[英]pandas dropna() doesn't work if you load csv in chunks
我正在使用chunksize加載~24GB的csv文件
reader = pd.read_csv(in_file, chunksize=10000)
for chunk in reader:
chunk.dropna(inplace=True)
...
我正在運行的問題是csv文件仍然具有空值。 知道那可能是什么嗎?
我最終做的是
reader = pd.read_csv(in_file, chunksize=10000)
for chunk in reader:
chunk = chunk.dropna()
...
感謝@kabanus和@ user32185的幫助。 我還使用dask來幫助處理文件大小。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.