簡體   English   中英

如何在RDD中合並數組

[英]How to merge Arrays in RDD

我是Spark的新手。 我有以下RDD [Array [(String,String,String)]]

val r1 = sc.parallelize(Array(Array(("123","456","789"),("AAA","BBB","CCC")),Array(("DDD","EEE","FFF"),("E1","E2","E3"))))

我想在其中合並Arrays

Array((123,456,789), (AAA,BBB,CCC), (DDD,EEE,FFF), (E1,E2,E3))

我可以用r1.reduce(_ ++ _)來做到這一點。 但是,我想使用轉換函數,如map,而不是Actions。 有可能嗎? 我正在使用Spark 1.3.1。

謝謝

你可以做:

val res: RDD[(String, String, String)] = r1.flatMap(identity)

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM