[英]Convert compressed sparse matrix to dataframe
當試圖將一個大致(2,000,000x3)個熱編碼值數組轉換為數據幀時,我遇到一個“ DataFrame構造函數未正確調用!”。 錯誤。
我也曾明確嘗試將數組包裝在np.asarray()中,但出現“必須通過二維輸入”錯誤。
enc = skp.OneHotEncoder()
X_ismale = enc.fit_transform(X.IsMaleBucket.values.reshape(-1,1))
X_ismale = pd.DataFrame(X_ismale,columns=['IsMale_'+str(i) for i in np.sort(X.IsMaleBucket.unique())])
X_ismale具有類型:
<2256308x3 sparse matrix of type '<class 'numpy.float64'>'
with 2256308 stored elements in Compressed Sparse Row format>
錯誤如前所述。
我希望可以無誤地轉換為數據框,但無法實現。
熊貓不能使用稀疏矩陣,而只能使用密集數據。 您可以使用to_array將稀疏矩陣轉換為密集數組。 – jdehesa 9分鍾前
盡管當前版本為toarray,但使用to_array還是可以的。
謝謝。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.