如何在包含至少一個下划線和大寫字母的字符串中查找單詞

Question

我想匹配包含的字符串中的所有單詞

至少有一個下划線（但這個詞不能既不開始也不結束）
至少兩個大寫字母
所有字母都必須是大寫的。

例如（這是我得到的最好結果）：

test_string = "test_string TEST_STRING TEST_string _TEST_STRING_ TESTSTRING ANOTHER_TEST_STRING"
p = re.compile("(\S*[A-Z_]\S*[_]\S*)") 
p.search(test_string)

我想從搜索方法中獲得的單詞是：

TEST_STRING（第二個字，不是_TEST_STRING_的子字符串）
ANOTHER_TEST_STRING

但我得到了

TEST_STRING
TEST_STRING（_TEST_STRING_的子字符串）。

謝謝

Answer 1

你的正則表達式(\\S*[A-Z_]\\S*[_]\\S*)使用\\S*來匹配非空白字符並重復那么多次，這樣你就可以匹配__或A_

您可以使用：

\b[A-Z]+_[A-Z_]*[A-Z]\b

說明

\\b字邊界
[AZ]+匹配1+大寫字符
_匹配下划線
[A-Z_]*匹配0次以上大寫字母或下划線
[AZ]匹配大寫字母
\\b字邊界

re.search將返回正則表達式匹配的第一個位置。 您可以使用findall代替：

import re
test_string = "test_string TEST_STRING TEST_string _TEST_STRING_ TESTSTRING ANOTHER_TEST_STRING"
p = re.compile(r"\b[A-Z]+_[A-Z_]*[A-Z]\b") 
print(re.findall(p,test_string))

結果

['TEST_STRING', 'ANOTHER_TEST_STRING']

請參閱正則表達式演示 | Python演示

Answer 2

這應該工作：

import re

regex = r"\b([A-Z]+(?:_[A-Z]+){1,})\b"
test_str = "test_string TEST_STRING TEST_string _TEST_STRING_ TESTSTRING ANOTHER_TEST_STRING"
matches = re.findall(regex, test_str, re.MULTILINE)

輸出：

>>> matches
['TEST_STRING', 'ANOTHER_TEST_STRING']

如何在包含至少一個下划線和大寫字母的字符串中查找單詞

問題描述

2 個解決方案

解決方案1
3 已采納 2019-01-11 16:42:10

解決方案2
0 2019-01-11 16:29:14

如何在包含至少一個下划線和大寫字母的字符串中查找單詞

問題描述

2 個解決方案

解決方案1 3 已采納 2019-01-11 16:42:10

解決方案2 0 2019-01-11 16:29:14

解決方案1
3 已采納 2019-01-11 16:42:10

解決方案2
0 2019-01-11 16:29:14