繁体   English   中英

Python正则表达式从字符串中删除电子邮件

[英]Python regex to remove emails from string

需要替换字符串中的电子邮件,因此:

inp = 'abc user@xxx.com 123 any@www foo @ bar 78@ppp @5555 aa@111"

应导致:

out = 'abc 123 foo bar"

使用什么正则表达式?

In [148]: e = '[^\@]\@[^\@]'
In [149]: pattern = re.compile(e)
In [150]: pattern.sub('', s)  
Out[150]: 'one aom 123 4two'
In [151]: s
Out[151]: 'one ab@com 123 4 @ two'

对我不起作用

更换:
\\S*@\\S*\\s?
通过''

在这里演示

一些解释:
\\S* :可以匹配尽可能多的非空格字符
@ :然后是@
\\S* :然后是另一个非空格字符序列
\\s? :最后有一个空格(如果有)。 请注意,“?” 需要与行尾的地址匹配。 由于“?”的贪婪性,如果有空格,它将始终被匹配。

我个人更喜欢自己解析字符串。 让我们尝试分割字符串并删除带有@符号的项目:

inp = 'abc user@xxx.com 123 any@www foo @ bar 78@ppp @5555 aa@111'
items = inp.split()

现在我们可以做这样的事情:

>>> [i for i in items if '@' not in i]
['abc', '123', 'foo', 'bar']

那使我们快到了。 让我们对其进行一些修改以添加join

>>> ' '.join([i for i in inp.split() if '@' not in i])
'abc 123 foo bar'

它可能不是RegEx,但适用于您输入的内容。

out = ' '.join([item for item in inp.split() if '@' not in item])

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM