[英]Find and replace various substrings in a Pandas Dataframe
我想找到各種值並替換/命名它們,例如:
DATA.str.replace(['Banana', 'banana', 'galaxy', 'S9'],['CpyX', 'CpyX', 'ProductA', 'ProductB'],inplace=True)
如果字符串完全匹配,則可以使用。
但是,例如,如果我有'Test Bananas'
,它不能代替Banana
。
謝謝。
IIUC,在您的參數中使用regex=True
df.replace(from, to, regex=True)
可重現的示例:
df = pd.DataFrame({'col1': ['String Number One', 'String Number Two']})
col1
0 String Number One
1 String Number Two
這樣
df.replace('Number', 'NewWord')
col1
0 String Number One
1 String Number Two
然而,
df.replace('Number', 'NewWord', regex=True)
col1
0 String NewWord One
1 String NewWord Two
可以正常工作。
喜歡
d=dict(zip(['Banana', 'banana', 'galaxy', 'S9'],['CpyX', 'CpyX', 'ProductA', 'ProductB'])
DATA.replace(d,inplace=True,regex=True)
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.