簡體   English   中英

如何在Scala Spark中將RDD [Double]轉換為矢量

[英]How to convert RDD[Double] to Vector in Scala Spark

我有一個Doubleed的IndexedRowMatrix。 我想計算矩陣每一行的總和並將結果保存到Vector。 之后,我要廣播此向量。 我正在創建一個Doubles的RDD,其中包含總和,但無法將其轉換為矢量。 因此,主要的問題是如何從IndexedRowMatrix創建我想要的Vector。

收集給駕駛員並構造一個載體:

import org.apache.spark.mllib.linalg.{Vector, Vectors}

val sc: SparkContext = ???
val rdd: RDD[Double] = ???
val vec: Vector = Vectors.dense(rdd.collect)
val broadcastVec = sc.broadcast(vec)

參考文獻:

https://spark.apache.org/docs/2.1.0/mllib-data-types.html#local-vector https://spark.apache.org/docs/latest/programming-guide.html#broadcast-variables

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM