[英]read json into multiple spark dataframes using scala
我的json結構是這樣的:
{
"posts": [],
"persons": [],
"organizations": [],
"meta": {
"sources": [
"http://loksabha.nic.in/",
"http://wikidata.org/",
"http://gender-balance.org/"
]
},
"memberships": [],
"events": [],
"areas": []
}
我想將帖子讀入數據框,但帖子是json對象的數組。 與其他json數組類似,但“ meta”除外。 應該將“元” json對象內的“源”數組讀入另一個數據幀。
無論如何,使用spark scala可以實現此目的。
任何幫助是極大的贊賞。
在此先感謝Shakti
您可以使用擴展功能。 我想你有類似的東西
val jsonDf = spark.read.json("your_json.json")
val postsDf = jsonDF.withColumn("post", explode(col("posts")).select("post")
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.