簡體   English   中英

如何從 pandas df 中刪除奇怪的編碼

[英]How to remove strange encoding from pandas df

我有以下df:

import pandas as pd

df = pd.DataFrame({"name" : ["a", "b", "c"], "value" : ['1\xa0412', 4, 2]})

我想用 1 替換 '1\xa0412'。我試試這個:

df['value'] = df['value'].str.replace(r'\\.*', '', regex=True)

但它不起作用。 請問我該如何解決?

先嘗試使用unidecode庫處理數據,再嘗試替換。 對於類似的問題,它對我有用。

嘗試:

df.value = df.value.apply(repr).str.replace(r"(\\.*)|\'", r"", regex=True)

結果:

    name    value
0   a       1
1   b       4
2   c       2

但要小心,因為列value的類型是object 如果您想要另一個 dtype,則必須轉換該列。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM