python 正则表达式：行尾的反向匹配

Question

我正在使用正则表达式来匹配日志中的模式。 我需要在开始时匹配模式，然后反转匹配，即：

我需要匹配这一行：

reject: RCPT from unknown[165.231.143.153]: 450 4.7.25 from=<spameri@tiscali.it> to=<spameri@tiscali.it>

但不是这一行：

reject: RCPT from unknown[165.231.143.153]: 450 4.7.25 from=<spameri@tiscali.it> to=<alice@mydomain.com>

基本上，如果该行包含to=<alice@mydomain.com> （或任何其他带有mydomain.com的 email 地址，则它不应触发匹配。否则，如果它是其他内容，即to=<bob@otherdomain.com>或to=<alice@thirddomain.com>那么它应该匹配。

我尝试使用这种消极的前瞻模式：

'^reject: RCPT from [A-Za-z0-9\.-]+\[{ip}\]: .* to=<[A-Za-z0-9\._-]+@(?!mydomain.com)>',

我在哪里否定mydomain.com使用构造构造(?.mydomain.com)

我怎样才能做到这一点？

Answer 1

前瞻是非消耗性的，即正则表达式索引保持在原来的位置，并且匹配的模式不会添加到总体匹配值中。

因此， (?.mydomain.com) in (?.mydomain.com)>检查是否没有mydomain ，任何字符com紧邻当前位置的右侧，并且由于下一个字符必须是> ，它总是真的。

您需要在>之前使用 char，因此您可以使用

^reject: RCPT from [A-Za-z0-9.-]+\[{ip}]: .* to=<[A-Za-z0-9._-]+@(?!mydomain\.com>)[^>]*>

注意你不需要转义. 在方括号（又名字符类）内，当它不在字符 class 内时，你不需要转义] 。

@(?.mydomain\.com>)[^>]*>匹配

@ - 一个@字符
(?.mydomain\.com>) - 不紧跟mydomain.com>
[^>]* -（否定字符 class 匹配）除>以外的任何零个或多个字符
> - 一个>字符。

python 正则表达式：行尾的反向匹配

问题描述

1 个解决方案

解决方案1
2 已采纳 2021-01-14 08:28:46

python 正则表达式：行尾的反向匹配

问题描述

1 个解决方案

解决方案1 2 已采纳 2021-01-14 08:28:46

解决方案1
2 已采纳 2021-01-14 08:28:46