簡體   English   中英

Pyspark將RowMatrix轉換為DataFrame或RDD

[英]Pyspark converting RowMatrix to DataFrame or RDD

我有一個方形的pyspark RowMatrix ,看起來像這樣:

>>> row_mat.numRows()
100
>>> row_mat.numCols()
100
>>> row_mat.rows.first()
SparseVector(100, {0: 0.0, 1: 0.0018, 2: 0.1562, 3: 0.0342...})

我想運行pyspark.ml.feature.PCA ,但它的fit()方法只接受一個DataFrame 有沒有辦法將此RowMatrix轉換為DataFrame

或者有更好的方法嗎?

使用:

row_mat.rows.map(lambda x: (x, )).toDF()

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM