python多行正则表达式findall

Question

我正在尝试使用分隔符在多行文本中找到多个匹配项，以在 python 中使用正则表达式停止搜索......如果我需要的内容都在同一行，我的查询很适合我要完成的任务： re.findall('([a-zA-Z]{3}\\d-[aAeE][rRsS]\\d.*), 输出)

问题是，有时我试图捕获的附加数据不适合同一行并转到下一行......是否有办法将模式匹配设置为在找到下一个匹配项或命中时停止分隔符（= 在这种情况下）？ 下面有两个匹配项的简化示例，我需要能够同时捕获...

例子

Port Id Description
3/2/4 Part of aggregate interface lag-4. Next device in path sea1-as2
lag-4, sea1-as2 3/1/2.

Answer 1

看来你所要做的就是添加[\\s\\S]*? 捕获下一行中的任何内容并包括预期的停靠点, | . , | . 停止比赛。 请注意，使[\\s\\S]*? 懒惰，否则，它将匹配整个事情。

print(re.findall(r'([a-zA-Z]{3}\d-[aAeE][rRsS]\d[\s\S]*?\d)(?:,|\.)', output))

输出

['sea1-as2 lag-4', 'sea1-as2 3/1/2']

Answer 2

你提到了[a-zA-Z]和[aAeE][rRsS] 。 有几种方法可以设置re.IGNORECASE，这样[ae][rs]就足够了。

您没有说清楚是使用re.MULTILINE还是在评估正则表达式之前删除换行符。 你以.*结尾，这可能会变成

[^=]*

如果你想要一切都到=分隔符。

或者，在评估正则表达式之前，您可以在\\n换行符和=相等上拆分，因此您可以提交适当大小的块进行评估。