繁体   English   中英

如何在引用字符“之间包含大写字母的熊猫”读取csv行?

[英]How to read csv lines with pandas containing “ and ' between quoting character ”?

我正在尝试使用熊猫read_csv导入csv,但无法使包含以下代码段的行正常工作:

“”,“”,“” BSF“代码-间歇式,请参见注释”,“”

我可以通过使用error_bad_lines=False, low_memory=False, engine='c'来传递它。 但是,应该可以正确解析它们。 我对正则表达式不好,所以我还没有尝试使用engine='python', sep=regex 谢谢你的帮助。

好吧,这是一个相当困难的工作...鉴于所有字段都被引用了,因此您可以使用正则表达式仅使用,后跟“作为分隔符:

data = pd.read_csv(filename,sep=r'(?<="),(?=")',quotechar='"')

但是,您仍然会在所有字段周围加上引号,但是可以通过应用以下方法解决此问题

data = data.applymap(lambda s:s[1:-1])

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM