簡體   English   中英

將壓縮的稀疏矩陣轉換為數據幀

[英]Convert compressed sparse matrix to dataframe

當試圖將一個大致(2,000,000x3)個熱編碼值數組轉換為數據幀時,我遇到一個“ DataFrame構造函數未正確調用!”。 錯誤。

我也曾明確嘗試將數組包裝在np.asarray()中,但出現“必須通過二維輸入”錯誤。

enc = skp.OneHotEncoder()
X_ismale = enc.fit_transform(X.IsMaleBucket.values.reshape(-1,1))
X_ismale = pd.DataFrame(X_ismale,columns=['IsMale_'+str(i) for i in np.sort(X.IsMaleBucket.unique())])

X_ismale具有類型:

<2256308x3 sparse matrix of type '<class 'numpy.float64'>'
    with 2256308 stored elements in Compressed Sparse Row format>

錯誤如前所述。

我希望可以無誤地轉換為數據框,但無法實現。

熊貓不能使用稀疏矩陣,而只能使用密集數據。 您可以使用to_array將稀疏矩陣轉換為密集數組。 – jdehesa 9分鍾前

盡管當前版本為toarray,但使用to_array還是可以的。

謝謝。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM