字符串模式正则表达式python

Question

我是正则表达式的新手。 我编写了以下正则表达式以在给定的字符串中找到abababab9 。 正则表达式返回两个结果，但是我期待一个结果。

testing= re.findall(r'((ab)*[0-9])',temp);


**Output**: [('abababab9', 'ab')]

按照我的理解，它应该只返回abababab9 ，为什么它返回ab 孤单。

Answer 1

您没有阅读findall文档：

返回字符串中所有不重叠匹配项的列表。

如果模式中存在一个或多个捕获组，则返回一个组列表；否则，返回一个列表。 如果模式包含多个组，则这将是一个元组列表。

空匹配项包含在结果中。

如果您看一下re模块，捕获组是括在括号中的子模式，如(ab) 。

如果您只想获得完全匹配，则可以使用以下解决方案之一：

re.findall(r'(?:ab)*[0-9]', temp)  # use non-capturing groups

[groups[0] for groups in re.findall(r'(ab)*[0-9]', temp)] # take the first group

[match.group() for match in re.finditer(r'(ab)*[0-9]', temp)] # use finditer

Answer 2

您已经通过(...)两个匹配组进行了配置， 第一个组是((ab)*[0-9]) ， 第二个组是(ab) 。 因此，您将获得这两个结果。 要仅获得第一个组，可以使第二个成为非捕获组 。 这是通过?:完成的。 因此，此结果未交付。

((?:ab)*[0-9])

正则表达式可视化

Debuggex演示

这只匹配abababab9 。

编辑1：

这是对正则表达式的分组概念的解释：分组和捕获

Answer 3

在内部使用?:删除第二个组捕获(ab) ：

testing= re.findall(r'((?:ab)*[0-9])',temp);

字符串模式正则表达式python

问题描述

3 个解决方案

解决方案1
2 2014-03-28 13:36:10

解决方案2
1 2014-03-28 13:35:56

解决方案3
0 2014-03-28 13:31:00

字符串模式正则表达式python

问题描述

3 个解决方案

解决方案1 2 2014-03-28 13:36:10

解决方案2 1 2014-03-28 13:35:56

解决方案3 0 2014-03-28 13:31:00

解决方案1
2 2014-03-28 13:36:10

解决方案2
1 2014-03-28 13:35:56

解决方案3
0 2014-03-28 13:31:00