簡體   English   中英

使用Apache Spark和Scala解析JSON數據

[英]Parse JSON data with Apache Spark and Scala

點擊這里查看圖片

我有這種類型的數據文件,其中每行都是一個JSON對象,除了前幾個單詞(請參閱附件)。 我想使用Spark和Scala解析此類文件。 我已經使用sqlContext.read.json(“ json文件的路徑”)進行了嘗試,但是由於整個數據都不是JSON對象,因此出現了錯誤(數據損壞)。 如何將此JSON文件解析為SQL數據框?

嘗試這個:

val rawRdd = sc.textFile("path-to-the-file")
val jsonRdd = rawRdd.map(_.substring(32)) //32 - number of first characters to ignore

val df = spark.read.json(jsonRdd)

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM