簡體   English   中英

列名稱中的未知字符

[英]Unknown characters in column name

我有這樣的df:

Allotments   NDWI   TWI
1             2     4
2             3     6

我試圖重命名列,但是當我打印時:

df.columns.values

這返回:

['\xef\xbb\xbfAllotments' 'NDWI' 'TWI']

當我查看df時,它只是說Allotments 如何刪除那些多余的字符?

我試過了

df.rename(columns=lambda x: x.strip())

但沒有運氣。

您可以將encoding='utf-8'作為kwarg read_csv給read_csv,以便其正確解碼BOM。

這是一個UTF-8字節順序標記 您可以對內容進行重新編碼以解決此問題。

x = ['\xef\xbb\xbfAllotments', 'NDWI', 'TWI']
x = [s.decode("utf-8-sig").encode("utf-8") for s in x]
print(x) # => ['Allotments', 'NDWI', 'TWI']

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM