一個正則表達式模式，匹配所有以 s 開頭的單詞開始並在以 s 開頭的單詞之前停止的單詞

Question

我正在嘗試捕獲字符串中的單詞，以便第一個單詞以 s 開頭，如果下一個單詞也以 s 開頭，正則表達式將停止匹配。

例如。 我有字符串“Stack、Code 和 StackOverflow”。 我只想捕獲“堆棧、代碼和”，而不是在匹配中包含“StackOverflow”。

這就是我的想法：

以空格開頭，后跟 s。
匹配所有內容，除非該組是一個空格和一個 s（我使用的是負前瞻）。

我試過的正則表達式：

(?<=\s)S[a-z -,]*(?!(\sS))

我不知道如何讓它工作。

Answer 1

我認為這應該有效。 我從這個線程改編了正則表達式。 您也可以在這里進行測試。 我還包括了一個非正則表達式的解決方案。 我基本上跟蹤第一次出現的以“s”開頭的單詞和下一個以“s”開頭的單詞，並獲取該范圍內的單詞。

import re

teststring = " Stack, Code and StackOverflow"
extractText = re.search(r"(\s)[sS][^*\s]*[^sS]*", teststring)

print(extractText[0])

#non-regex solution
listwords = teststring.split(' ')

# non regex solution
start = 0
end = 0
for i,word in enumerate(listwords):
    if word.startswith('s') or word.startswith('S'):
        if start == 0:
            start = i
        else:
            end = i
            break

newstring = " " + " ".join([word for word in listwords[start:end]])
print(newstring)

Output

 Stack, Code and
 Stack, Code and

Answer 2

您可以使用例如捕獲組：

(S(?<!\S.).*?)\s*S(?<!\S.)

解釋

(捕獲組 1
- S(?<.\S.)匹配S並斷言S的左側沒有空白邊界
- .*? 匹配任意字符，盡可能少
)關閉組
\s*匹配可選的空白字符
S(?<.\S.)匹配S並斷言S的左側沒有空白邊界

請參閱正則表達式演示和Python 演示。

示例代碼：

import re

pattern = r"(S(?<!\S.).*?)\s*S(?<!\S.)"
s = "Stack, Code and StackOverflow"
m = re.search(pattern, s)
if m:
    print(m.group(1))

Output

Stack, Code and

另一種選擇使用環視將S斷言到右側而不使用它以允許多個匹配項相互匹配：

 S(?<!\S.).*?(?=\s*S(?<!\S.))

正則表達式演示

import re

pattern = r"S(?<!\S.).*?(?=\s*S(?<!\S.))"
s = "Stack, Code and StackOverflow test Stack"
print(re.findall(pattern, s))

Output

['Stack, Code and', 'StackOverflow test']

一個正則表達式模式，匹配所有以 s 開頭的單詞開始並在以 s 開頭的單詞之前停止的單詞

問題描述

2 個解決方案

解決方案1
0 已采納 2022-11-28 05:34:25

Output

解決方案2
0 2022-11-28 09:14:44

一個正則表達式模式，匹配所有以 s 開頭的單詞開始並在以 s 開頭的單詞之前停止的單詞

問題描述

2 個解決方案

解決方案1 0 已采納 2022-11-28 05:34:25

Output

解決方案2 0 2022-11-28 09:14:44

解決方案1
0 已采納 2022-11-28 05:34:25

解決方案2
0 2022-11-28 09:14:44