正则表达式在第二次出现字符后匹配相邻数字

Question

遇到以下问题：

我有一个字符串“ABC.123.456XX”，我想使用正则表达式来提取第二个句点之后的 3 个数字字符。 真的为此苦苦挣扎，并希望有任何新的见解，这是我得到的最接近的结果，但它并不真正接近我想要的：

'.*\.(.*?\.\d{3})'

我提前感谢任何帮助 - 谢谢。

Answer 1

如果您的输入始终采用类似的格式，例如xxx.xxx.xxxxx ，那么一种解决方案是字符串操作：

>>> s = 'ABC.123.456XX'
>>> '.'.join(s.split('.')[2:])[0:3]

解释

在'.'.join(s.split('.')[2:])[0:3]行中：

s.split('.')将字符串拆分成列表['ABC', '123', '456XX']
'.'.join(s.split('.')[2:])在第二个元素之后加入列表的其余部分，所以'456XX'
[0:3]选择索引0到索引2（含）的substring，所以结果为456

Answer 2

点，非点两次，然后在捕获组 1 中跟随 3 位数字

[^.]*(?:\.[^.]*){2}(\d{3})

https://regex101.com/r/qWpfHx/1

展开

 [^.]* 
 (?: \. [^.]* ){2}
 ( \d{3} )                     # (1)

Answer 3

这个表达式也可以正常工作：

[^\r\n.]+\.[^\r\n.]+\.([0-9]{3})

测试

import re

regex = r'[^\r\n.]+\.[^\r\n.]+\.([0-9]{3})'
string = '''
ABC.123.456XX
ABCOUOU.123123123.000871XX
ABCanything_else.123123123.111871XX
'''

print(re.findall(regex, string))

Output

['456', '000', '111']

如果您想简化/修改/探索表达式，它已在regex101.com的右上角面板上进行了解释。 如果您愿意，您还可以在此链接中观看它如何与一些示例输入匹配。

正则表达式在第二次出现字符后匹配相邻数字

问题描述

3 个解决方案

解决方案1
2 2019-10-08 21:59:09

解决方案2
2

解决方案3
1 已采纳 2019-10-08 22:02:17

测试

Output

正则表达式在第二次出现字符后匹配相邻数字

问题描述

3 个解决方案

解决方案1 2 2019-10-08 21:59:09

解决方案2 2

解决方案3 1 已采纳 2019-10-08 22:02:17

测试

Output

解决方案1
2 2019-10-08 21:59:09

解决方案2
2

解决方案3
1 已采纳 2019-10-08 22:02:17