簡體 English 中英

為什么python pandas dataFrame的內存消耗這么大？

[英]Why the memory consumption of python pandas dataFrame is so big?

原文 2015-09-03 14:10:14 2 1 python/ pandas/ large-files/ multi-index

我正在處理非常大的文本文件（大約 4GB）

該文件有 3 列，其中前兩列是字符串，第三列是浮點數。
我首先使用pandas.read_csv()加載此文件 - 前兩列將作為索引（2 個字符串的元組）中的鍵，浮點數將位於一列中。
鑒於我有一個 DataFrame（由read_csv()生成），我需要使用預定義的鍵列表從第三列中獲取值。

當我嘗試使用loc()或lookup() ，內存使用量急劇增加到 ~16GB，這會導致線程由於內存交換而變得非常慢。

為什么會發生這種情況？ 我的任務還有其他選擇嗎？

這是我的代碼的快照：

similarity_df = pd.read_csv(similarity_dir, sep=' ', header=None, index_col=[0, 1])

values_df = similarity_df.loc[list_tup]

1 個解決方案

我遇到了同樣的問題。 這是因為多索引。 如果可能，避免對大量數據集使用 MultiIndexes

為什么我的熊貓數據框使用這么多內存？

[英]Why my pandas dataframe use so many memory?

python，對大熊貓數據框的操作

[英]python, operation on big pandas Dataframe

熊貓數據框內存python

[英]pandas dataframe memory python

通過使用每列的縮放數據來減少 Pandas DataFrame 內存消耗？

[英]Reducing pandas DataFrame memory consumption by use of scaled data for each column?

Pyarrow：將stream讀入pandas dataframe高ZCD69B4957F06CD818D7BF3DEDE6198

[英]Pyarrow: read stream into pandas dataframe high memory consumption

Parquet 文件大於 memory 消耗 pandas DataFrame

[英]Parquet file larger than memory consumption of pandas DataFrame

熊貓 - 巨大的內存消耗

[英]Pandas - Huge memory consumption

熊貓DataFrame的RAM消耗

[英]RAM consumption by pandas DataFrame

Python 單元測試內存消耗

[英]Python unittest memory consumption

python ESL的內存消耗

[英]Memory consumption of python ESL

暫無

暫無

聲明:本站的技術帖子網頁，遵循CC BY-SA 4.0協議，如果您需要轉載，請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

相關問題 為什么我的熊貓數據框使用這么多內存？ python，對大熊貓數據框的操作熊貓數據框內存python 通過使用每列的縮放數據來減少 Pandas DataFrame 內存消耗？ Pyarrow：將stream讀入pandas dataframe高ZCD69B4957F06CD818D7BF3DEDE6198 Parquet 文件大於 memory 消耗 pandas DataFrame 熊貓 - 巨大的內存消耗熊貓DataFrame的RAM消耗 Python 單元測試內存消耗 python ESL的內存消耗

相關標簽

粵ICP備18138465號 © 2020-2024 STACKOOM.COM