[英]How to replace part of email address with another string in pandas?
我有一个带有电子邮件地址的数据框。 我需要用'.mn'替换每个电子邮件地址的结尾。 结尾的意思是'.org','。com'等。
Ex. John@smith.com becomes John@smith.mn
不确定我做错了什么。
这是我到目前为止,但这不是替换或给我一个错误信息:
email['ADDR'] = email['ADDR'].str.replace(r'[.]{2,}', '.mn')
先感谢您。
这应该做:
email['ADDR'] = email['ADDR'].str.replace('.{3}$', 'mn')
如果需要处理可变长度域( .edu
, .com1
等),可以使用:
email
ADDR
0 john@smith.com
1 test@abc.edu
2 foo@bar.abcd
email['ADDR'].str.replace('\..{2,}$', '.mn')
0 john@smith.mn
1 test@abc.mn
2 foo@bar.mn
Name: ADDR, dtype: object
另一种处理可变长度顶级结尾的方法是使用str.rsplit
:
In[72]:
df = pd.DataFrame({'email':['John@smith.com','John@smith.x','John@smith.hello']})
df
Out[72]:
email
0 John@smith.com
1 John@smith.x
2 John@smith.hello
In[73]:
df['email'] = df['email'].str.rsplit('.').str[0] +'.mn'
df
Out[73]:
email
0 John@smith.mn
1 John@smith.mn
2 John@smith.mn
这将找到最后一个尾随点,左侧并附加新的所需后缀
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.