[英]How to read csv lines with pandas containing “ and ' between quoting character ”?
我正在尝试使用熊猫read_csv导入csv,但无法使包含以下代码段的行正常工作:
“”,“”,“” BSF“代码-间歇式,请参见注释”,“”
我可以通过使用error_bad_lines=False, low_memory=False, engine='c'
来传递它。 但是,应该可以正确解析它们。 我对正则表达式不好,所以我还没有尝试使用engine='python', sep=regex
。 谢谢你的帮助。
好吧,这是一个相当困难的工作...鉴于所有字段都被引用了,因此您可以使用正则表达式仅使用,后跟“作为分隔符:
data = pd.read_csv(filename,sep=r'(?<="),(?=")',quotechar='"')
但是,您仍然会在所有字段周围加上引号,但是可以通过应用以下方法解决此问题
data = data.applymap(lambda s:s[1:-1])
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.