如何在正則表達式中選擇多行？

Question

我有一些遵循這種模式的HTML：

<p>1. ALLCAPSTEXT1 - etc etc</p>
<p>01. lowercasetext1 - etc etc</p>
<p>02. lowercasetext1 - etc etc</p>
<p>2. ALLCAPSTEXT2 - etc etc</p>
<p>01. lowercasetext2 - etc etc</p>
<p>02. lowercasetext2 - etc etc</p>
<p>03. lowercasetext2 - etc etc</p>
<p>3. ALLCAPSTEXT3 - etcetc</p>
<p>01. lowercasetext3 - etc etc</p>

“ ALLCAPSWORD”行之后的行數有所不同，因此可以在1到10+之間的任意位置。 我想用這種模式選擇所有這些行（最多100行）。

到目前為止，我有：

<p>(\d+)\.\s[A-Z][A-Z]+(.+)</p>\n+<p>(.+)</p>\n+<p>\d+\.\s[A-Z][A-Z]+(.+)</p>

其中第一個p標簽中的內容捕獲具有全大寫文字的行，然后轉到下一行，p標簽中的內容捕獲具有小寫文字的該行，然后轉到具有大寫形式的下一行文本。

所以我希望它能得到所有這些：

<p>1. ALLCAPSTEXT1 - etc etc</p>
<p>01. lowercasetext1 - etc etc</p>
<p>02. lowercasetext1 - etc etc</p>

但它只捕獲全大寫文本之后的第一行，然后跳至全大寫文本的下一行，並執行相同的操作。

<p>1. ALLCAPSTEXT1 - etc etc</p>
<p>01. lowercasetext1 - etc etc</p>

然后轉到：

<p>2. ALLCAPSTEXT2 - etc etc</p>
<p>01. lowercasetext2 - etc etc</p

關於如何獲取所有具有小寫字母的行的提示，直到到達全大寫文本的下一行，然后沖洗並重復？

Answer 1

可以這樣

(?m)^.*?ALLCAPSTEXT.*(?:(?!^.*?ALLCAPSTEXT)[\\S\\s])*

https://regex101.com/r/TfDsL9/1

展開式

 (?m)
 ^ .*? ALLCAPSTEXT .* 
 (?:
      (?! ^ .*? ALLCAPSTEXT )
      [\S\s] 
 )*

Answer 2

<p>\d+\.\s[A-Z]+.*<\/p>(\n+<p>\d+\.\s[a-z]+.*<\/p>)+

如何在正則表達式中選擇多行？

問題描述

2 個解決方案

解決方案1
0

解決方案2
0 2017-07-28 21:53:13

如何在正則表達式中選擇多行？

問題描述

2 個解決方案

解決方案1 0

解決方案2 0 2017-07-28 21:53:13

解決方案1
0

解決方案2
0 2017-07-28 21:53:13