匹配除正则表达式模式之外的所有内容

Question

我有一个 xml 内容如下

<html>
<head><title>502 Bad Gateway</title></head>
<body>
<center><h1>502 Bad Gateway</h1></center>
</body>
</html>

在上面，我想处理除标题中的502 Bad Gateway之外的所有内容。

我使用下面的正则表达式来匹配502 Bad Gateway

(?<=title>)(.*?)(?=<\/title>)

有人可以告诉我如何否定它吗？

我尝试了以下建议

(?!((?<=title>)(.*?)(?=<\/title>)))
[^((?<=title>)(.*?)(?=<\/title>))]

但他们没有奏效。

我正在使用 ruby 正则表达式

Answer 1

你想得到正则表达式不匹配的所有内容吗？

使用您喜欢的语言保存结果。

使用一些工具，例如：

其中一些可以生成补丁。 使用 File -> Open... 打开两个版本进行比较。 这将使您对所做的更改有一个很好的了解。 https://docs.moodle.org/dev/How_to_create_a_patch#Creating_a_patch_using_WinMerge

Answer 2

您可以只使用sub删除title中的“502 Bad Gateway”：

xml = "<head><title>502 Bad Gateway</title></head>"
xml.sub("<title>502 Bad Gateway</title>", "<title></title>")
# => "<head><title></title></head>"

Answer 3

对 ruby 不太熟悉，但我认为正则表达式的功能与 PCRE 相似，它支持控制动词和递归。

这是与您的描述相匹配的正则表达式：

((?<=title>)502 Bad Gateway(?=<\/title>))(*SKIP)(*F)|(?:(?!(?1))[\s\S])+

见证明