![](/img/trans.png)
[英]Apache Spark (Scala) - print 1 entry of an RDD / pairRDD
[英]Iterate over spark cogroup() pairrdd output in scala
我在Spark中創建了2對RDD
var pairrdd = sc.parallelize(List((1,2),(3,4),(3,6)))
var pairrdd2 = sc.parallelize(List((3,9)))
我應用了cogroup函數
var cogrouped = pairrdd.cogroup(pairrdd2)
cogroupedrdd的對象類型如下所示。
cogrouped: org.apache.spark.rdd.RDD[(Int, (Iterable[Int], Iterable[Int]))] = MapPartitionsRDD[801] at cogroup at <console>:60
我正在嘗試創建一個函數來迭代這些值
def iterateThis((x: Int,(x1:Iterable[Int],x2:Iterable[Int])))={
println(x1.mkString(","))
}
但我得到以下錯誤。
<console>:21: error: identifier expected but '(' found.
def iterateThis((x: Int,(x1:Iterable[Int],x2:Iterable[Int])))={
^
您的參數的類型為(Int, (Iterable[Int], Iterable[Int]))
:
def iterateThis(arg: (Int, (Iterable[Int], Iterable[Int]))) = {
val (_, (x1, _)) = arg
println(x1.mkString(","))
}
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.