Python，正则表达式，提取大括号内的分组电子邮件

Question

我正在尝试从字符串中提取多封电子邮件。 我正在使用这个正则表达式：

re.findall(r'[\w\.-]+@[\w\.-]+(?:\.[\w]+)+', text)

它工作正常，但有时在文本中 Email 具有相同域的名称分组在大括号中：

{annie,bonnie}@gmail.com

所以我的问题是如何正确解析它并提取为单独的电子邮件：
annie@gmail.com, bonnie@gmail.com ？

我尝试修改正则表达式以考虑括号和逗号，然后使用简单的 function，但在这种情况下，我从字符串中得到了很多垃圾。

任何帮助表示赞赏。

Answer 1

您可以使用

(?:{([^{}]*)}|\b\w[\w.-]*)(@[\w.-]+\.\w+)

请参阅正则表达式演示。 详情：

(?:{([^{}]*)}|\b\w[\w.-]*) - 非捕获组匹配：
{([^{}]*)} - 一个{ ，然后第 1 组捕获除{和}之外的任何零个或多个字符，然后是一个}
| - 或者
\b\w[\w.-]* - 一个单词边界（它将使匹配更有效），一个单词字符，然后是零个或多个单词、点或连字符字符
(@[\w.-]+\.\w+) - 第 2 组：一个@ ，一个或多个单词、点或连字符，然后是. 和一个或多个单词字符。

请参阅Python 演示：

import re
text = "Emails like {annie,bonnie}@gmail.com, annie2@gmail.com, then a bonnie2@gmail.com."
emails = []
rx_email = re.compile( r'(?:{([^{}]*)}|\b\w[\w.-]*)(@[\w.-]+\.\w+)' )
for m in rx_email.finditer(text):
    if m.group(1):
        for email in m.group(1).split(','):
            emails.append(f'{email}{m.group(2)}')
    else:
        emails.append(m.group())
print(emails)
# => ['annie@gmail.com', 'bonnie@gmail.com', 'annie2@gmail.com', 'bonnie2@gmail.com']

逻辑是

获取@前面带有{...}的电子邮件，同时将大括号内的内容捕获到第 1 组，将@...捕获到第 2 组
检查组 1 是否匹配，如果是，则用逗号分隔内容并通过将逗号分隔的用户名与域部分连接来构建结果匹配项
如果第 1 组不匹配，则仅 append 将匹配值添加到结果列表中。

Answer 2

您可以将re.findall与列表理解一起使用：

inp = "{annie,bonnie}@gmail.com"
parts = re.findall(r'\{(.*?)\}(@\S+)\b', inp)[0]
emails = [email + parts[1] for email in parts[0].split(',')]
print(emails)

这打印：

['annie@gmail.com', 'bonnie@gmail.com']

Answer 3

x = 'xy2@gmail.com data@gmail.com google@gmail.com {annie,bonnie}@gmail.com'
q = []
for i,j in enumerate(x):
    if '{' == j or '}' ==j :
        q.append(i)  
    
y1 = x[q[0]+1:q[1]]
a1 = y1.replace(','," ")
a1 = a1.split(" ")
z = [i+'@gmail.com' for i in a1]

x = x.replace("{",'')
y = x.replace("}",'')
z1 = " ".join(z)
z2 = y.replace(y1,z1

Python，正则表达式，提取大括号内的分组电子邮件

问题描述

3 个解决方案

解决方案1
2 已采纳 2021-04-05 16:13:24

解决方案2
1 2021-04-05 15:01:18

解决方案3
0 2021-04-05 16:12:40

Python，正则表达式，提取大括号内的分组电子邮件

问题描述

3 个解决方案

解决方案1 2 已采纳 2021-04-05 16:13:24

解决方案2 1 2021-04-05 15:01:18

解决方案3 0 2021-04-05 16:12:40

解决方案1
2 已采纳 2021-04-05 16:13:24

解决方案2
1 2021-04-05 15:01:18

解决方案3
0 2021-04-05 16:12:40