逃避[在Python正則表達式中

Question

這個reg exp搜索正確檢查字符串是否包含harry文本：

re.search(r'\bharry\b','[harry] blah',re.IGNORECASE)

但是，我需要確保字符串包含[harry] 。 我嘗試使用各種數量的反斜杠進行轉義：

re.search(r'\b\[harry\]\b','[harry] blah',re.IGNORECASE)
re.search(r'\b\\[harry\\]\b','[harry] blah',re.IGNORECASE)
re.search(r'\b\\\[harry\\\]\b','[harry] blah',re.IGNORECASE)

這些解決方案都沒有找到匹配。 我需要做什么？

謝謝！

Answer 1

第一個是正確的：

r'\b\[harry\]\b'

但這不會與[harry] blah匹配，因為[不是單詞字符，所以沒有單詞邊界。 只有在前面有一個單詞字符時才會匹配[就像在foobar[harry] blah 。

Answer 2

>>> re.search(r'\bharry\b','[harry] blah',re.IGNORECASE)
<_sre.SRE_Match object at 0x7f14d22df648>
>>> re.search(r'\b\[harry\]\b','[harry] blah',re.IGNORECASE)
>>> re.search(r'\[harry\]','[harry] blah',re.IGNORECASE)
<_sre.SRE_Match object at 0x7f14d22df6b0>
>>> re.search(r'\[harry\]','harry blah',re.IGNORECASE)

問題是\\b ，而不是括號。 單個反斜杠對於轉義是正確的。

Answer 3

你以逃避大多數正則表達式元字符的方式逃脫它：前面加一個反斜杠。

因此， r"\\[harry\\]"將匹配文字字符串[harry] 。

問題在於你的模式中的\\b 。 這是單詞邊界錨 。

\\b匹配：

在字符串的開頭，如果它以單詞字符開頭
在字符串的末尾，如果它以單詞字符結尾
在單詞字符\\w和非單詞字符\\W （注意案例差異）

括號[和]不是單詞字符，因此如果字符串以[開頭[ ，則其左側沒有\\b 。 任何沒有\\b地方都有\\B代替（注意案例差異）。

參考

regular-expressions.info/Word Boundaries
http://docs.python.org/library/re.html

\\b ：匹配空字符串，但僅匹配單詞的開頭或結尾。 單詞被定義為字母數字或下划線字符的序列，因此單詞的結尾由空格或非字母數字的非下划線字符表示。 請注意， \\b被定義為\\w和\\W之間的邊界，因此被視為字母數字的精確字符集取決於UNICODE和LOCALE標志的值。 在字符范圍內， \\b表示退格符，以便與Python的字符串文字兼容。

逃避[在Python正則表達式中

問題描述

3 個解決方案

解決方案1
5 已采納 2010-08-05 10:36:46

解決方案2
1 2010-08-05 10:37:03

解決方案3
0 2010-08-05 10:35:16

參考

逃避[在Python正則表達式中

問題描述

3 個解決方案

解決方案1 5 已采納 2010-08-05 10:36:46

解決方案2 1 2010-08-05 10:37:03

解決方案3 0 2010-08-05 10:35:16

參考

解決方案1
5 已采納 2010-08-05 10:36:46

解決方案2
1 2010-08-05 10:37:03

解決方案3
0 2010-08-05 10:35:16