[英]Read zipped txt file as pandas dataframe
我正在嘗試將壓縮的 txt 文件讀取為 pandas dataframe。 雖然解壓后的文件格式是txt,但是里面有逗號分隔的值。
按照here的答案,我使用了:
path = 'data_folder/data.2020.ZIP'
df = pd.read_csv(path, compression='zip', header=None, sep=',')
print(df.head())
但它拋出了這個錯誤:
ParserError:錯誤標記數據。 C 錯誤:預計第 23 行中的 37 個字段,看到 80
我正在使用 python 3.6 和 pandas 版本 0.24.2。 升級 pandas 有幫助嗎?
所以發生這種情況是因為各行中的列數不規則,並且由於我不想刪除任何數據,所以我使用具有最大列數的names
參數來解決問題,如下所示:
path = 'data_folder/data.2020.ZIP'
df = pd.read_csv(path, compression='zip', header=None, sep=',', names=range(80))
print(df.head())
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.