簡體   English   中英

如何修復熊貓 csv 閱讀器上的“錯誤標記數據”?

[英]How can I fix "Error tokenizing data" on pandas csv reader?

我正在嘗試使用 Pandas 讀取 csv 文件。

該文件實際上只有一行,但是每當我嘗試讀取它時都會導致錯誤。

第 8 行似乎發生了錯誤,但我幾乎找不到第 8 行,因為上面顯然只有一行。

我喜歡:

with codecs.open("path_to_file", "rU", "Shift-JIS", "ignore") as file:

df = pd.read_csv(file, header=None, sep="\t")
df

然后我得到:

ParserError: Error tokenizing data. C error: Expected 1 fields in line 8, saw 3

我不明白到底發生了什么,所以你的任何建議將不勝感激。

我為此苦苦掙扎了將近半天,我用記事本打開了 csv 並注意到分隔符是 TAB 而不是逗號,然后嘗試了 belo 組合。

df = pd.read_csv('C:\\myfile.csv',sep='\t', lineterminator='\r')

嘗試df = pd.read_csv(file, header=None, error_bad_lines=False)

現有答案不會在您的數據框中包含這些額外的行。 如果您希望您的數據框與其最寬點一樣寬,您可以使用以下內容:

delimiter = ','
max_columns = max(open(path_name, 'r'), key = lambda x: x.count(delimiter)).count(delimiter)
df = pd.read_csv(path_name, header = None, skiprows = 1, names = list(range(0,max_columns)))

如果確實有標題,則設置 skiprows = 1,以后您始終可以檢索標題列名稱。 您還可以識別填充的列數多於原始標題中列名數的行。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM