如何使用逗号分隔符和逗号分隔符读取熊猫CSV文件

Question

我有一个csv文件，其行如下所示： 87.89，“ 2,392.05”，14.77,373.2 （第三行有逗号分隔符）

熊猫一直将第二列中的逗号视为行分隔符，并显示“错误标记数据”错误。

大熊猫之间有没有人可以忽略双引号之间的昏迷？ 谢谢

样本行：

9999992613813558569,87.89,"2,392.05",14.77,373.2
9999987064038821584,95.11,"3,397.04",42.15,"1,461.14"
9999956300203713283,6.67,194.02,41.23,"1,105.45"
9999946809576027532,15.08,353.84,29.43,591.9

编辑：

我已经尝试了：

read_csv(file, quotechar='"', encoding='latin1', thousands=',')
read_csv(file, quotechar='"', encoding='latin1', escapechar ='"')

Answer 1

尝试阅读：

pd.read_csv(myfile, encoding='latin1', quotechar='"')

包含这些内容的每一列都将被视为type object 。 一旦掌握了这一点，就可以使用float：

df = df.apply(lambda x: pd.to_numeric(x.astype(str).str.replace(',',''), errors='coerce'))

另外，您可以尝试：

pd.read_csv(myfile, encoding='latin1', quotechar='"', error_bad_lines=False)

在这里，您可以看到原始csv中遗漏的内容-引起问题的原因。

对于省略的每一行，您将收到Warning而不是Error 。

Answer 2

这为我工作：

pd.read_csv(myfile, encoding='latin1', quotechar='"', thousands=',')

如何使用逗号分隔符和逗号分隔符读取熊猫CSV文件

问题描述

2 个解决方案

解决方案1
2 已采纳 2018-05-17 09:56:28

解决方案2
0 2019-09-30 18:25:36

如何使用逗号分隔符和逗号分隔符读取熊猫CSV文件

问题描述

2 个解决方案

解决方案1 2 已采纳 2018-05-17 09:56:28

解决方案2 0 2019-09-30 18:25:36

解决方案1
2 已采纳 2018-05-17 09:56:28

解决方案2
0 2019-09-30 18:25:36