[英]Importing only a few columns of a csv as a python pandas dataframe?
我只想將 csv 的一個子集作為 dataframe 導入,因為它太大而無法導入整個內容。 有沒有辦法在 pandas 中本地執行此操作,而無需設置類似數據庫的結構?
我嘗試只導入一個塊然后連接,這仍然太大並導致 memory 錯誤。 我有數百列,因此手動指定 dtypes 可能會有所幫助,但可能會花費大量時間。
df_chunk = pd.read_csv("filename.csv", chunksize=1e7)
df = pd.concat(df_chunk,ignore_index=True)
您可以使用 read_csv function 中的skiprows
和nrows
read_csv
僅加載原始 dataframe 中的一部分行。
例如:
import pandas as pd
df = pd.read_csv("test.csv", skiprows = 4, nrows=10)
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.