[英]Saving RDD's in for loop in scala
我有一個for循環,其中每次迭代都會得到一個RDD,我想將其保存以備后用。 保存和訪問這些RDD的最有效方法是什么?
我在這里先向您的幫助表示感謝!
不含RDD和spark細節的示例代碼:
scala> val res = (for (i <- (1 to 10);
| j=2*i;
| k= s"i: $i j: $j") yield k)
res: scala.collection.immutable.IndexedSeq[String] = Vector(i: 1 j: 2, i: 2 j: 4, i: 3 j: 6, i: 4 j: 8, i: 5 j: 10, i: 6 j: 12, i: 7 j: 14, i: 8 j: 16, i: 9 j: 18, i: 10 j: 20)
scala> res(0)
res201: String = i: 1 j: 2
scala> res(1)
res202: String = i: 2 j: 4
因此,只需生成您的RDD,並以Seq的形式收集它們,以備后用。
您也可以產生多個值
yield (i, j, k)
然后解構元組N,對其進行過濾,分組等。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.