繁体   English   中英

熊猫读csv加零

[英]Pandas read csv adds zeros

我在从原始源数据中读取带有混合dtypes的id字段的csv时遇到问题,即id字段可以是11、2R399004,BL327838、7等,但其中绝大多数是8个字符长。

当我使用pd.read_csv的多个版本读取它,并且encoding ='iso-8859-1'时,它总是将7和11转换为00000007等。 我尝试使用utf-8,但出现以下错误:

UnicodeDecodeError:“ utf-8”编解码器无法解码位置40的字节0xc9:数据意外结束

我试过设置dtype = {'field':object}和string以及latin-1之类的各种迭代之类的东西,但是它将不断地这样做。

有没有解决每个错误的方法,而无需遍历每个文件并修复dtypes?

基本上列看起来像这样

列_ID 10 HGF6558 059 KP257 0001

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM