簡體   English   中英

zipWithIndex rdd具有初始值

[英]zipWithIndex rdd with initial value

我有一個這樣的RDD:

+----------+--------+
|firstName |lastName|
+----------+--------+
|      john|   smith|
|      anna|  tourde|
+----------+--------+

我會像創建zipWithIndex一樣創建一個新列,但給定和初始值為8。

+----------+--------+-----+
|firstName |lastName|index|
+----------+--------+-----+
|      john|   smith|    8|
|      anna|  tourde|    9|
+----------+--------+-----+

你有什么主意嗎? 謝謝

rdd.zipWithIndex().map { case (v, ind) =>
  (v, ind + 8)
}

使用zipWithIndex並轉換回數據zipWithIndex ,如下所示

val df1 = spark.sqlContext.createDataFrame(
    df.rdd.zipWithIndex.map {
  case (row, index) => Row.fromSeq(row.toSeq :+ index + 8)
},
// Create schema for index column
StructType(df.schema.fields :+ StructField("index", LongType, false)))

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM