[英]Regex match everything except word
所有关于匹配某些东西的质量检查, 除了带有负向超前的单词 ,我发现这暗示着行的开始/结束( ^
$
)。 但是我不知道如何匹配除已处理文本中间的其他单词之前的单词以外的所有内容( .*
等任何字符)。
我应该在<tag></tag>
匹配ABC
:
...<tag>a a.__aABC&*</tag>aaa<tag>ffff</tag>...
但不在外面(假阳性):
...<tag>a a.__a&*</tag>ABC<tag>ffff</tag>...
因此,我认为我应该排除ABC
之前的标签关闭( </tag>
)。 我试过了:
<tag>(?!<\/tag>)ABC.*?<\/tag>
但是这样一来, 除了</tag>
在ABC
之前,不允许匹配.*
。 我该如何实施?
有用的链接:
由于您使用的是Perl / PCRE,因此最快的方法是这样的:
/(?s)<tag>(?:<\\/tag>(*SKIP)(*FAIL)|.)*?ABC.*?<\\/tag>/
https://regex101.com/r/AoiwIH/1
扩展
(?s)
<tag>
(?:
</tag>
(*SKIP) (*FAIL)
|
.
)*?
ABC
.*?
</tag>
基准与断言方法的比较
Regex1: (?s)<tag>(?:</tag>(*SKIP)(*FAIL)|.)*?ABC.*?</tag>
Completed iterations: 50 / 50 ( x 1000 )
Matches found per iteration: 1
Elapsed Time: 0.25 s, 254.91 ms, 254905 µs
Matches per sec: 196,151
Regex2: (?s)<tag>(?:(?!</tag>).)*?ABC.*?</tag>
Completed iterations: 50 / 50 ( x 1000 )
Matches found per iteration: 1
Elapsed Time: 0.33 s, 329.10 ms, 329095 µs
Matches per sec: 151,931
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.