簡體 English 中英

zipWithIndex rdd具有初始值

[英]zipWithIndex rdd with initial value

原文 2017-08-04 08:49:45 8 2 scala/ apache-spark/ rdd

我有一個這樣的RDD：

+----------+--------+
|firstName |lastName|
+----------+--------+
|      john|   smith|
|      anna|  tourde|
+----------+--------+

我會像創建zipWithIndex一樣創建一個新列，但給定和初始值為8。

+----------+--------+-----+
|firstName |lastName|index|
+----------+--------+-----+
|      john|   smith|    8|
|      anna|  tourde|    9|
+----------+--------+-----+

你有什么主意嗎？ 謝謝

2 個解決方案

rdd.zipWithIndex().map { case (v, ind) =>
  (v, ind + 8)
}

使用zipWithIndex並轉換回數據zipWithIndex ，如下所示

val df1 = spark.sqlContext.createDataFrame(
    df.rdd.zipWithIndex.map {
  case (row, index) => Row.fromSeq(row.toSeq :+ index + 8)
},
// Create schema for index column
StructType(df.schema.fields :+ StructField("index", LongType, false)))

無法將帶有zipWithIndex的rdd轉換為Spark中的數據幀

[英]Unable to convert an rdd with zipWithIndex to a dataframe in spark

Scala 中 .zipWithIndex 和自定義索引值之間的區別

[英]Difference between .zipWithIndex and custom index value in Scala

zipWithIndex在MapPartitionsRDD上

[英]zipWithIndex on MapPartitionsRDD

Spark：在reduceByKey之后轉換為初始RDD

[英]Spark: convert to initial RDD after reduceByKey

如果初始 RDD 不為空，為什么 RDD.groupBy 會返回一個空的 RDD？

[英]Why does RDD.groupBy return an empty RDD if the initial RDD wasn't empty?

[英]Key/Value pair RDD

根據另一個RDD的值更新RDD

[英]Updating an RDD based on value of the other RDD

在rdd中搜索另一個rdd的值

[英]search rdd for value from another rdd

在鍵值 RDD 中尋找最大值

[英]Finding Maximum in Key Value RDD

在 Spark RDD 中尋找最大值

[英]Finding the max value in Spark RDD

暫無

暫無

聲明:本站的技術帖子網頁，遵循CC BY-SA 4.0協議，如果您需要轉載，請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

相關問題 無法將帶有zipWithIndex的rdd轉換為Spark中的數據幀 Scala 中 .zipWithIndex 和自定義索引值之間的區別 zipWithIndex在MapPartitionsRDD上 Spark：在reduceByKey之后轉換為初始RDD 如果初始 RDD 不為空，為什么 RDD.groupBy 會返回一個空的 RDD？鍵/值對RDD 根據另一個RDD的值更新RDD 在rdd中搜索另一個rdd的值在鍵值 RDD 中尋找最大值在 Spark RDD 中尋找最大值

相關標簽

粵ICP備18138465號 © 2020-2024 STACKOOM.COM