重新模式以匹配非数字文本前面的所有 n 位数字

Question

我想用 Python 3.7.5 为这个任务构建一个正则表达式。 输入文本如下：

alkdj flajf
123 adlf ja;ld fj 999
423 234 2359 kalfji lkja;lkd999

我的目标是检索所有处于领先位置的数字，每个数字后有一个空格字符，并获得如下所示的列表

[]
[123]
[423, 234, 2359]

任何建议表示赞赏！

Answer 1

import re

data = '''
alkdj flajf
123 adlf ja;ld fj 999
423 234 2359 kalfji lkja;lkd999
'''
pattern = re.compile(r'([0-9 ]+) \w.*?')

pattern.findall(data)

输出：

['123', '423 234 2359']

Answer 2

如果您想单独捕获数字，我们可以使用花哨的\\G continue 运算符：

import regex as re
rgx = r"(?|^(\d+)|\G \K(\d+))"
test_str = ("alkdj flajf\n"
    "123 adlf ja;ld fj 999\n"
    "423 234 2359 kalfji lkja;lkd999")

matches = re.finditer(rgx, test_str, re.MULTILINE)
for match in matches:
    print(match.group(1))

演示（演示需要 PCRE，这就是我导入替代正则表达式模块的原因）

我还使用分支重置(?|)和\\K丢弃运算符来使事情正常进行。

重新模式以匹配非数字文本前面的所有 n 位数字

问题描述

2 个解决方案

解决方案1
2 2020-03-24 20:30:16

解决方案2
0 2020-03-24 21:50:30

重新模式以匹配非数字文本前面的所有 n 位数字

问题描述

2 个解决方案

解决方案1 2 2020-03-24 20:30:16

解决方案2 0 2020-03-24 21:50:30

解决方案1
2 2020-03-24 20:30:16

解决方案2
0 2020-03-24 21:50:30