![](/img/trans.png)
[英]Pandas read_csv wrongly adds zeros and a random number at the end
[英]Pandas read csv adds zeros
我在從原始源數據中讀取帶有混合dtypes的id字段的csv時遇到問題,即id字段可以是11、2R399004,BL327838、7等,但其中絕大多數是8個字符長。
當我使用pd.read_csv的多個版本讀取它,並且encoding ='iso-8859-1'時,它總是將7和11轉換為00000007等。 我嘗試使用utf-8,但出現以下錯誤:
UnicodeDecodeError:“ utf-8”編解碼器無法解碼位置40的字節0xc9:數據意外結束
我試過設置dtype = {'field':object}和string以及latin-1之類的各種迭代之類的東西,但是它將不斷地這樣做。
有沒有解決每個錯誤的方法,而無需遍歷每個文件並修復dtypes?
基本上列看起來像這樣
列_ID 10 HGF6558 059 KP257 0001
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.