簡體   English   中英

在scala spark中迭代數組或任何其他集合中的RDD和存儲值

[英]Iterate RDD and Stored value in Array Or Any other Collection in scala spark

我是 Scala 的新手。 我正在迭代 RDD 並將每個值存儲在數組或任何其他集合中。 但是值不存儲在 Array 中。

val ItrRdd = sqlContext.sql("select district,state FROM world ").rdd
var ItrRdd_data = ItrRdd.map { x =>
       (x.getString(0), x.getString(1))
    }

var district = Array[String]()

ItrRdd_data.map{ x => 
      district.+:(x._1)
    }   

然后如果我打印分區,那么它將是空白的。 有人可以幫我做這個或其他類似上面的。

提前致謝。

使用下面的來計算district

val district = ItrRdd_data.map({ case(x,y) => x -> y }).collect()

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM