簡體   English   中英

在數據框中全局替換部分字符串

[英]Replace part of string globally in dataframe

我有以下數據框:

id   feature
1    p.Asp25Asn
2    p.Gly25Asn
3    p.Ile20Tyr

我想替換“功能”列的一部分。

例如:匹配時的Asp 應替換為'D'。 Asn 匹配時應替換為 'N' 等其他列值,如 Gly --> G, Ile -->I, Tyr -->Y

預期的輸出是:

id   feature
1    p.D25N
2    p.G25N
3    p.I20Y

我正在編寫一個匹配條件並在全局執行此類替換的函數。 如果有更好的解決方案,請提出建議。

謝謝

您可以使用字典使用pandas.DataFrame.replace

df=pd.DataFrame({'id':[1,2,3],'feature':['p.Asp25Asn','p.Gly25Asn','p.Ile20Tyr']})
>>>df
   id     feature
0   1  p.Asp25Asn
1   2  p.Gly25Asn
2   3  p.Ile20Tyr

mydict={'Asp':'D','Asn':'N','Gly':'G','Ile':'I','Tyr':'Y'}
df = df.replace({"feature": mydict},regex=True)
>>>df
   id   feature
0   1    p.D25N
1   2    p.G25N
2   3    p.I20Y

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM