繁体   English   中英

熊猫read_csv EOF内部字符串从行开始

[英]Pandas read_csv EOF inside string starting at line

我遇到了熊猫read_csv的问题。 我有一个文件,其中包含“作为字段值。”实际上不应该这样,但是我对文件生成没有影响,因此我必须找到一种解决方法。

pandas.errors.ParserError:标记数据时出错。 C错误:字符串内EOF从15345行开始

我在Git上找到了有关此问题的报告( 链接在此处 ),他们建议在其中将用于“ sep”参数的分隔符也用于“ quotechar”。 在这种情况下,文件的结构会混乱。

我所做的另一件事是为此添加了一个例外,该例外将为其余文件运行代码,但是对于特定类型的文件,我将继续遇到该问题。

我用来读取CSV文件的命令:

df_new = pd.read_csv(file_path_name, sep=";", error_bad_lines=False)

任何解决方法的想法(例如,忽略此问题)? 我想一种方法是使用csv库删除该行(或用其他东西替换“”),但是我想保持它的简单并在熊猫中尽可能多地执行。

python版本:3.6.2

熊猫版:0.21.0

感谢你并致以真诚的问候

仅想指出@ user8505495的建议有效(再次感谢您)。

基本上只是将参数quoting=3添加到read_csv to_csv使用相同的参数to_csv导致和出错(缺少转义字符)。 一种选择是设置escapechar参数,或者只是不使用quoting参数。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM