簡體   English   中英

有沒有辦法讓 pandas read_csv function 更快

[英]Is there a way to make pandas read_csv function faster

目前,我正在處理一個很大的文件(大約 45GB)我正在嘗試使用 pandas read_csv function 加載文件,但是,加載文件需要永遠。 有沒有辦法加快這個過程?

我正在考慮將文件分成幾塊並使用多處理加載它們。

或者有沒有更好的方法來做到這一點?

編輯:我認為在 read_csv() 中使用 chunksize 參數是最好的選擇

您可以使用modin.pandas參考此鏈接,其中顯示了read_csv的性能差異。

根據我使用 modin 的經驗,它比 pandas 快。 但還沒有嘗試過使用 45GB 數據。 你可以試一試

您也可以嘗試使用Dask點擊這里

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM