簡體   English   中英

熊貓讀csv加零

[英]Pandas read csv adds zeros

我在從原始源數據中讀取帶有混合dtypes的id字段的csv時遇到問題,即id字段可以是11、2R399004,BL327838、7等,但其中絕大多數是8個字符長。

當我使用pd.read_csv的多個版本讀取它,並且encoding ='iso-8859-1'時,它總是將7和11轉換為00000007等。 我嘗試使用utf-8,但出現以下錯誤:

UnicodeDecodeError:“ utf-8”編解碼器無法解碼位置40的字節0xc9:數據意外結束

我試過設置dtype = {'field':object}和string以及latin-1之類的各種迭代之類的東西,但是它將不斷地這樣做。

有沒有解決每個錯誤的方法,而無需遍歷每個文件並修復dtypes?

基本上列看起來像這樣

列_ID 10 HGF6558 059 KP257 0001

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM