簡體 English 中英

優化 Pandas 內存使用

[英]Optimize Pandas Memory Usage

原文 2022-06-26 02:24:19 8 1 python/ pandas/ database

我正在嘗試導入數據。 我收到Memory Error 。 我增加了虛擬內存，數據大小為 2.71 GB。 想着提前設置數據類型來優化內存消耗，於是找到了這個網站： Optimize Pandas Memory Usage for Large Datasets

base_path = pathlib.Path('dataset')

base_airbnb = pd.DataFrame()

for file in base_path.iterdir():
    df = pd.read_csv(r'dataset\{}'.format(file.name))
    base_airbnb = base_airbnb.append(df)
    
display(base_airbnb)

如何設置 pandas 列類型以減少內存消耗？

ParserError: Error tokenizing data. C error: out of memory

1 個解決方案

首先，不推薦使用df.append ，而應使用pd.concat 。

base_path = pathlib.Path('dataset')
base_airbnb = []

for file in base_path.iterdir():
    base_airbnb.append(pd.read_csv(rf'dataset\{file.name}', dtype={'a': np.float64, 'b': np.int32, 'c': 'Int64'})

base_airbnb = pd.concat(base_airbnb)

至於如何設置 dtypes... 遵循文檔中給出的模式。

{'a': np.float64, 'b': np.int32, 'c': 'Int64'}

優化內存使用，代碼選擇

[英]Optimize memory usage, code selection

Pandas內存使用不一致

[英]Pandas memory usage inconsistencies

Pandas memory 使用和 memory 分配

[英]Pandas memory usage and memory allocation

如何優化此代碼以減少內存使用量？

[英]How to optimize this code to reduce memory usage?

優化 memory 用於生成和拆分列表的用法

[英]Optimize memory usage for generating and splitting list

使用 Pandas DataFrame 減少內存使用

[英]Reducing memory usage with Pandas DataFrame

熊貓數據幀按內存使用量划分

[英]Pandas dataframe split by memory usage

熊貓的內存使用情況以用於SparseSeries列表

[英]pandas' memory usage for list of SparseSeries

優化內存使用-Pandas / Python

[英]Optimizing memory usage - Pandas/Python

重新編制索引時熊貓的內存使用情況

[英]pandas memory usage when reindexing

暫無

暫無

聲明:本站的技術帖子網頁，遵循CC BY-SA 4.0協議，如果您需要轉載，請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

相關問題 優化內存使用，代碼選擇 Pandas內存使用不一致 Pandas memory 使用和 memory 分配如何優化此代碼以減少內存使用量？優化 memory 用於生成和拆分列表的用法使用 Pandas DataFrame 減少內存使用熊貓數據幀按內存使用量划分熊貓的內存使用情況以用於SparseSeries列表優化內存使用-Pandas / Python 重新編制索引時熊貓的內存使用情況

相關標簽

粵ICP備18138465號 © 2020-2024 STACKOOM.COM