簡體   English   中英

使用scala將json讀入多個spark數據幀

[英]read json into multiple spark dataframes using scala

我的json結構是這樣的:

{
  "posts": [],
  "persons": [],
  "organizations": [],
  "meta": {
    "sources": [
      "http://loksabha.nic.in/",
      "http://wikidata.org/",
      "http://gender-balance.org/"
    ]
  },
  "memberships": [],
  "events": [],
  "areas": []
}

我想將帖子讀入數據框,但帖子是json對象的數組。 與其他json數組類似,但“ meta”除外。 應該將“元” json對象內的“源”數組讀入另一個數據幀。

無論如何,使用spark scala可以實現此目的。

任何幫助是極大的贊賞。

在此先感謝Shakti

您可以使用擴展功能。 我想你有類似的東西

val jsonDf = spark.read.json("your_json.json")
val postsDf = jsonDF.withColumn("post", explode(col("posts")).select("post")

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM