在熊貓數據框中查找並替換各種子字符串

Question

我想找到各種值並替換/命名它們，例如：

DATA.str.replace(['Banana', 'banana', 'galaxy', 'S9'],['CpyX', 'CpyX', 'ProductA', 'ProductB'],inplace=True)

如果字符串完全匹配，則可以使用。

但是，例如，如果我有'Test Bananas' ，它不能代替Banana 。

謝謝。

Answer 1

IIUC，在您的參數中使用regex=True

df.replace(from, to, regex=True)

可重現的示例：

df = pd.DataFrame({'col1': ['String Number One', 'String Number Two']})

    col1
0   String Number One
1   String Number Two

這樣

df.replace('Number', 'NewWord')

    col1
0   String Number One
1   String Number Two

然而，

df.replace('Number', 'NewWord', regex=True)

    col1
0   String NewWord One
1   String NewWord Two

可以正常工作。

Answer 2

喜歡

d=dict(zip(['Banana', 'banana', 'galaxy', 'S9'],['CpyX', 'CpyX', 'ProductA', 'ProductB'])
DATA.replace(d,inplace=True,regex=True)