[英]How to remove strange encoding from pandas df
我有以下df:
import pandas as pd
df = pd.DataFrame({"name" : ["a", "b", "c"], "value" : ['1\xa0412', 4, 2]})
我想用 1 替換 '1\xa0412'。我試試這個:
df['value'] = df['value'].str.replace(r'\\.*', '', regex=True)
但它不起作用。 請問我該如何解決?
先嘗試使用unidecode庫處理數據,再嘗試替換。 對於類似的問題,它對我有用。
嘗試:
df.value = df.value.apply(repr).str.replace(r"(\\.*)|\'", r"", regex=True)
結果:
name value
0 a 1
1 b 4
2 c 2
但要小心,因為列value
的類型是object
。 如果您想要另一個 dtype,則必須轉換該列。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.