如何修復熊貓 csv 閱讀器上的“錯誤標記數據”？

Question

我正在嘗試使用 Pandas 讀取 csv 文件。

該文件實際上只有一行，但是每當我嘗試讀取它時都會導致錯誤。

第 8 行似乎發生了錯誤，但我幾乎找不到第 8 行，因為上面顯然只有一行。

我喜歡：

with codecs.open("path_to_file", "rU", "Shift-JIS", "ignore") as file:

df = pd.read_csv(file, header=None, sep="\t")
df

然后我得到：

ParserError: Error tokenizing data. C error: Expected 1 fields in line 8, saw 3

我不明白到底發生了什么，所以你的任何建議將不勝感激。

Answer 1

我為此苦苦掙扎了將近半天，我用記事本打開了 csv 並注意到分隔符是 TAB 而不是逗號，然后嘗試了 belo 組合。

df = pd.read_csv('C:\\myfile.csv',sep='\t', lineterminator='\r')

Answer 2

嘗試df = pd.read_csv(file, header=None, error_bad_lines=False)

Answer 3

現有答案不會在您的數據框中包含這些額外的行。 如果您希望您的數據框與其最寬點一樣寬，您可以使用以下內容：

delimiter = ','
max_columns = max(open(path_name, 'r'), key = lambda x: x.count(delimiter)).count(delimiter)
df = pd.read_csv(path_name, header = None, skiprows = 1, names = list(range(0,max_columns)))

如果確實有標題，則設置 skiprows = 1，以后您始終可以檢索標題列名稱。 您還可以識別填充的列數多於原始標題中列名數的行。

如何修復熊貓 csv 閱讀器上的“錯誤標記數據”？

問題描述

3 個解決方案

解決方案1
6 2020-06-16 13:54:04

解決方案2
3 2018-11-12 04:50:18

解決方案3
0 2019-04-05 18:30:26

如何修復熊貓 csv 閱讀器上的“錯誤標記數據”？

問題描述

3 個解決方案

解決方案1 6 2020-06-16 13:54:04

解決方案2 3 2018-11-12 04:50:18

解決方案3 0 2019-04-05 18:30:26

解決方案1
6 2020-06-16 13:54:04

解決方案2
3 2018-11-12 04:50:18

解決方案3
0 2019-04-05 18:30:26