[英]Scala RDD[(String,String)] to RDD[String]
我們正在讀取 UTF_8 格式的文件 RDD[(String,String)],需要幫助將其轉換為 RDD[String]。
val textRdd = sparkSession.sparkContext.binaryFiles(filePath,12)
.mapValues(content => new String(content.toArray(), StandardCharsets.UTF_8))
您只需要從元組即(字符串,字符串)中提取值。
val outRDD = textRdd.map(t=>t._2) // To get first value use t._1
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.