簡體   English   中英

在scala中將RDD保存在for循環中

[英]Saving RDD's in for loop in scala

我有一個for循環,其中每次迭代都會得到一個RDD,我想將其保存以備后用。 保存和訪問這些RDD的最有效方法是什么?

我在這里先向您的幫助表示感謝!

不含RDD和spark細節的示例代碼:

scala> val res = (for (i <- (1 to 10);
     |  j=2*i;
     |  k= s"i: $i j: $j") yield k)
res: scala.collection.immutable.IndexedSeq[String] = Vector(i: 1 j: 2, i: 2 j: 4, i: 3 j: 6, i: 4 j: 8, i: 5 j: 10, i: 6 j: 12, i: 7 j: 14, i: 8 j: 16, i: 9 j: 18, i: 10 j: 20)

scala> res(0)
res201: String = i: 1 j: 2

scala> res(1)
res202: String = i: 2 j: 4

因此,只需生成您的RDD,並以Seq的形式收集它們,以備后用。

您也可以產生多個值

yield (i, j, k)

然后解構元組N,對其進行過濾,分組等。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM