[英]Replace part of string globally in dataframe
我有以下數據框:
id feature
1 p.Asp25Asn
2 p.Gly25Asn
3 p.Ile20Tyr
我想替換“功能”列的一部分。
例如:匹配時的Asp 應替換為'D'。 Asn 匹配時應替換為 'N' 等其他列值,如 Gly --> G, Ile -->I, Tyr -->Y
預期的輸出是:
id feature
1 p.D25N
2 p.G25N
3 p.I20Y
我正在編寫一個匹配條件並在全局執行此類替換的函數。 如果有更好的解決方案,請提出建議。
謝謝
您可以使用字典使用pandas.DataFrame.replace 。
df=pd.DataFrame({'id':[1,2,3],'feature':['p.Asp25Asn','p.Gly25Asn','p.Ile20Tyr']})
>>>df
id feature
0 1 p.Asp25Asn
1 2 p.Gly25Asn
2 3 p.Ile20Tyr
mydict={'Asp':'D','Asn':'N','Gly':'G','Ile':'I','Tyr':'Y'}
df = df.replace({"feature": mydict},regex=True)
>>>df
id feature
0 1 p.D25N
1 2 p.G25N
2 3 p.I20Y
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.