另一個MultiLine Group正則表達式查詢

Question

因此，我試圖編寫一個正則表達式來過濾特定摘要的文本文件（尋找速度而不是蠻力）。

我想從每場比賽中得到三件事：

這是正則表達式（可以在此處找到失敗的測試工具-https : //gist.github.com/shiftkey/5236161 ）：

(?s)code start (?<key>[A-Za-z-]*) (?<language>[A-Za-z]*).*[\\n](?<value>.*?)[\\n].*end code (?<key>[A-Za-z-]*)

所以這樣的文件：

// code start foo csharp
var x = 1;
// end code foo

給我期望值：

但是，當我引入第二行的代碼片段時，我只會得到最后一行：

// code start foo csharp
var x = 1;
var y = 2;
// end code foo

代替

讓小組涵蓋多行內容時，我錯過了什么？

我已經看過在SO上提出的類似情況，但是這些情況不適用於我的用法。

Answer 1

可以通過更改兩個.*的貪婪來解決此問題：

(?s)code start (?<key>[A-Za-z-]*) (?<language>[A-Za-z]*).*?[\n](?<value>.*)[\n].*?end code (?<key>[A-Za-z-]*)

閱讀語言后的.*一定不要太貪婪，因為我們需要在第一行后加上內容作為摘要值。 但是，用於解析value的.*可能會更加貪婪，因為它不應該在遇到第一個\\n停止，因此是上面的模式。

Answer 2

如果您願意的話，還可以使用一些環顧四周的東西進行捕捉...

(?<=code\sstart\s)(?<key>\b\w+\b)\s(?<language>\b\w+\b).*\r\n(?<content>(?s).*)(?=\r\n.*end\scode\s\1\s-->)