[英]Escaping [ in Python Regular Expressions
這個reg exp搜索正確檢查字符串是否包含harry文本:
re.search(r'\bharry\b','[harry] blah',re.IGNORECASE)
但是,我需要確保字符串包含[harry] 。 我嘗試使用各種數量的反斜杠進行轉義:
re.search(r'\b\[harry\]\b','[harry] blah',re.IGNORECASE)
re.search(r'\b\\[harry\\]\b','[harry] blah',re.IGNORECASE)
re.search(r'\b\\\[harry\\\]\b','[harry] blah',re.IGNORECASE)
這些解決方案都沒有找到匹配。 我需要做什么?
謝謝!
第一個是正確的:
r'\b\[harry\]\b'
但這不會與[harry] blah
匹配,因為[
不是單詞字符,所以沒有單詞邊界。 只有在前面有一個單詞字符時才會匹配[
就像在foobar[harry] blah
。
>>> re.search(r'\bharry\b','[harry] blah',re.IGNORECASE)
<_sre.SRE_Match object at 0x7f14d22df648>
>>> re.search(r'\b\[harry\]\b','[harry] blah',re.IGNORECASE)
>>> re.search(r'\[harry\]','[harry] blah',re.IGNORECASE)
<_sre.SRE_Match object at 0x7f14d22df6b0>
>>> re.search(r'\[harry\]','harry blah',re.IGNORECASE)
問題是\\b
,而不是括號。 單個反斜杠對於轉義是正確的。
你以逃避大多數正則表達式元字符的方式逃脫它:前面加一個反斜杠。
因此, r"\\[harry\\]"
將匹配文字字符串[harry]
。
問題在於你的模式中的\\b
。 這是單詞邊界錨 。
\\b
匹配:
\\w
和非單詞字符\\W
(注意案例差異) 括號[
和]
不是單詞字符,因此如果字符串以[
開頭[
,則其左側沒有\\b
。 任何沒有\\b
地方都有\\B
代替(注意案例差異)。
\\b
:匹配空字符串,但僅匹配單詞的開頭或結尾。 單詞被定義為字母數字或下划線字符的序列,因此單詞的結尾由空格或非字母數字的非下划線字符表示。 請注意,\\b
被定義為\\w
和\\W
之間的邊界,因此被視為字母數字的精確字符集取決於UNICODE和LOCALE標志的值。 在字符范圍內,\\b
表示退格符,以便與Python的字符串文字兼容。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.