簡體   English   中英

在熊貓數據框中查找並替換各種子字符串

[英]Find and replace various substrings in a Pandas Dataframe

我想找到各種值並替換/命名它們,例如:

DATA.str.replace(['Banana', 'banana', 'galaxy', 'S9'],['CpyX', 'CpyX', 'ProductA', 'ProductB'],inplace=True) 

如果字符串完全匹配,則可以使用。

但是,例如,如果我有'Test Bananas' ,它不能代替Banana

謝謝。

IIUC,在您的參數中使用regex=True

df.replace(from, to, regex=True)

可重現的示例:

df = pd.DataFrame({'col1': ['String Number One', 'String Number Two']})

    col1
0   String Number One
1   String Number Two

這樣

df.replace('Number', 'NewWord')

    col1
0   String Number One
1   String Number Two

然而,

df.replace('Number', 'NewWord', regex=True)

    col1
0   String NewWord One
1   String NewWord Two

可以正常工作。

喜歡

d=dict(zip(['Banana', 'banana', 'galaxy', 'S9'],['CpyX', 'CpyX', 'ProductA', 'ProductB'])
DATA.replace(d,inplace=True,regex=True) 

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM