正则表达式（'foo'|'bar'）表示法

Question

我正在使用正则表达式来解析一些时间数据，但是我的尝试与预期不符。 这是我的代码：

import re
print re.findall("\d+:\d+ (am|pm)", "11:30 am - 2:20 pm")

这会产生['am', 'pm'] ，而不是['11:30 am', '2:20 pm'] ，这正是我想要的。

我可以用\\d+:\\d+ am|\\d+:\\d+ pm产生我想要的结果，但这有点钝了，我想知道为什么另一个不能正常工作？

Answer 1

您的问题与捕获组有关。 如果您想进行非捕捉式轮换，请使用regex \\d+:\\d+ (?:am|pm) 。

Answer 2

您甚至可能不需要正则表达式来拆分此特定字符串。 如果适用，可以使用常规的str.split() ：

>>> s = "11:30 am - 2:20 pm"
>>> s.split(" - ")
['11:30 am', '2:20 pm']

当然，这不会将项目强制为类似于“时间”的字符串。

Answer 3

引用文档（ 重点是我的 ）：

re.findall(pattern, string, flags=0)

返回字符串中模式的所有非重叠匹配项，作为字符串列表。 从左到右扫描该字符串，并以找到的顺序返回匹配项。 如果该模式中存在一个或多个组，则返回一个组列表；否则，返回一个列表。 如果模式包含多个组，则这将是一个元组列表。 空匹配项将包括在结果中，除非它们碰到另一个匹配项的开头。

您可以使用re.finditer ：

seq = [m.string[m.start():m.end()] for m in re.finditer("\d+:\d+ (am|pm)", "11:30 am - 2:20 pm")]
# ['11:30 am', '2:20 pm']

正则表达式（'foo'|'bar'）表示法

问题描述

3 个解决方案

解决方案1
4 已采纳 2016-09-05 16:56:07

解决方案2
1 2016-09-05 17:10:20

解决方案3
0 2016-09-05 17:02:34

正则表达式（&#39;foo&#39;|&#39;bar&#39;）表示法

问题描述

3 个解决方案

解决方案1 4 已采纳 2016-09-05 16:56:07

解决方案2 1 2016-09-05 17:10:20

解决方案3 0 2016-09-05 17:02:34

正则表达式（'foo'|'bar'）表示法

解决方案1
4 已采纳 2016-09-05 16:56:07

解决方案2
1 2016-09-05 17:10:20

解决方案3
0 2016-09-05 17:02:34