將dict轉換為數據框時熊貓出現內存錯誤

Question

我有一個約70K X 70K尺寸的字典變量，我想將其轉換為Dataframe以便通過以下方式進行進一步操作

wd=pd.DataFrame(wordDict)

但工作5分鍾后，出現以下錯誤：

subarr=np.empty(len(),dtype=dtyp)
Memory Error

我可以找到一些有關它的帖子， 但似乎這是熊貓和Numpy庫的一個常見問題，不幸的是沒有人可以提供具體答案 ，他們大多建議切片數據集並分兩步或三步進行處理。

只是我再次提出了這個問題，希望圖書館可以提供一些更新的數據來解決它，或者有一些技術可以克服。

作為總結 ; 是蟲子嗎？ 並且有任何其他解決方案可以將字典轉換為數據框謝謝

Answer 1

這不是錯誤。

大小為70k x 70k的數組意味着需要將49億個變量存儲在數據框中。

數據框相對於字典和列表之類的對象有開銷。 因此，您將需要字典使用兩倍以上的內存來構建數據框。

您需要考慮另一種使用數據的方式。 一些例子：

您尚未提供問題的詳細信息，以供我們進一步建議。