在Python中查找前N个正则表达式

Question

因此，这应该很容易，但是我却以某种方式错过了SO或Python文档的答案。 我正在使用此代码：

myregex.findall(source)

这将产生myregex的所有匹配项作为列表。 现在，问题在于源很长，我只需要出现前6个匹配myregex的子字符串。 我想如果找到前n个匹配项后停止匹配过程会更快。 我该怎么做：

myregex.findall(source, n)

？

Answer 1

使用re.finditer ：

import itertools
for m in itertools.islice(re.finditer(pat, text), 6):
    ...

re.finditer是一种生成器，可根据需要生成match对象。 您可以从m.group(0)获得完全匹配，或者从m.group(1)及更高版本获得单个模式匹配。

Answer 2

由于您需要性能，因此请使用regex.finditer

def my_find(regex, s, n):
    const = regex.finditer(s)
    return [const.next().groups() for i in range(n)]

或更安全的版本：

def my_find(regex, s, n):
    const = regex.finditer(s)
    ret_val = []
    for i in range(n):
        try:
            ret_val.append(const.next().groups())
        except StopIteration:
            return ret_val
    return ret_val

在Python中查找前N个正则表达式

问题描述

2 个解决方案

解决方案1
7 已采纳 2013-04-03 10:12:46

解决方案2
1 2013-04-03 10:12:09

在Python中查找前N个正则表达式

问题描述

2 个解决方案

解决方案1 7 已采纳 2013-04-03 10:12:46

解决方案2 1 2013-04-03 10:12:09

解决方案1
7 已采纳 2013-04-03 10:12:46

解决方案2
1 2013-04-03 10:12:09