簡體   English   中英

執行 pandas 內部合並時出現內存錯誤

[英]MemoryError when perforimg a pandas inner merge

我正在嘗試使用 pandas 合並兩個文件,其中一個非常大(6gb)。 每當我嘗試它時,我都會收到 Memory 錯誤,因為我的 RAM(8gb) 可能太小而無法處理。 關於如何解決這個問題的任何想法? 我的代碼是:

 import pandas as pd
broad_matched = pd.read_csv("FILE A", delim_whitespace=True)
broad_matched2 = broad_matched[~(broad_matched['P'] >= 0.05)]
SNPs= pd.read_csv("FILE B", 
                  sep='\t', 
                 names=["#CHROM","POS1","POS", "rsID","E","F"])
broad_matched2=broad_matched2.drop(columns=['LOG.OR._SE','ID','REF','ALT','ERRCODE','Z_STAT','OR','OBS_CT','TEST','FIRTH.','A1','#CHROM'])
Table1=pd.merge(broad_matched2,SNPs,on='POS',how='inner').dropna()
Table1.to_csv(r'D:/Table1', index = False)

你應該看看這篇文章 該解決方案涉及使用 dask 數據幀。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM