簡體   English   中英

將壓縮的 txt 文件讀取為 pandas dataframe

[英]Read zipped txt file as pandas dataframe

我正在嘗試將壓縮的 txt 文件讀取為 pandas dataframe。 雖然解壓后的文件格式是txt,但是里面有逗號分隔的值。

按照here的答案,我使用了:

path = 'data_folder/data.2020.ZIP'
df = pd.read_csv(path, compression='zip', header=None, sep=',')
print(df.head())

但它拋出了這個錯誤:

ParserError:錯誤標記數據。 C 錯誤:預計第 23 行中的 37 個字段,看到 80

我正在使用 python 3.6 和 pandas 版本 0.24.2。 升級 pandas 有幫助嗎?

所以發生這種情況是因為各行中的列數不規則,並且由於我不想刪除任何數據,所以我使用具有最大列數的names參數來解決問題,如下所示:

path = 'data_folder/data.2020.ZIP'
df = pd.read_csv(path, compression='zip', header=None, sep=',', names=range(80))
print(df.head())

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM