簡體   English   中英

逃避[在Python正則表達式中

[英]Escaping [ in Python Regular Expressions

這個reg exp搜索正確檢查字符串是否包含harry文本:

re.search(r'\bharry\b','[harry] blah',re.IGNORECASE)

但是,我需要確保字符串包含[harry] 我嘗試使用各種數量的反斜杠進行轉義:

re.search(r'\b\[harry\]\b','[harry] blah',re.IGNORECASE)
re.search(r'\b\\[harry\\]\b','[harry] blah',re.IGNORECASE)
re.search(r'\b\\\[harry\\\]\b','[harry] blah',re.IGNORECASE)

這些解決方案都沒有找到匹配。 我需要做什么?

謝謝!

第一個是正確的:

r'\b\[harry\]\b'

但這不會與[harry] blah匹配,因為[不是單詞字符,所以沒有單詞邊界。 只有在前面有一個單詞字符時才會匹配[就像在foobar[harry] blah

>>> re.search(r'\bharry\b','[harry] blah',re.IGNORECASE)
<_sre.SRE_Match object at 0x7f14d22df648>
>>> re.search(r'\b\[harry\]\b','[harry] blah',re.IGNORECASE)
>>> re.search(r'\[harry\]','[harry] blah',re.IGNORECASE)
<_sre.SRE_Match object at 0x7f14d22df6b0>
>>> re.search(r'\[harry\]','harry blah',re.IGNORECASE)

問題是\\b ,而不是括號。 單個反斜杠對於轉義是正確的。

你以逃避大多數正則表達式元字符的方式逃脫它:前面加一個反斜杠。

因此, r"\\[harry\\]"將匹配文字字符串[harry]

問題在於你的模式中的\\b 這是單詞邊界錨

\\b匹配:

  • 在字符串的開頭,如果它以單詞字符開頭
  • 在字符串的末尾,如果它以單詞字符結尾
  • 在單詞字符\\w和非單詞字符\\W (注意案例差異)

括號[]不是單詞字符,因此如果字符串以[開頭[ ,則其左側沒有\\b 任何沒有\\b地方都有\\B代替(注意案例差異)。

參考

  • regular-expressions.info/Word Boundaries
  • http://docs.python.org/library/re.html

    \\b :匹配空字符串,但僅匹配單詞的開頭或結尾。 單詞被定義為字母數字或下划線字符的序列,因此單詞的結尾由空格或非字母數字的非下划線字符表示。 請注意, \\b被定義為\\w\\W之間的邊界,因此被視為字母數字的精確字符集取決於UNICODE和LOCALE標志的值。 在字符范圍內, \\b表示退格符,以便與Python的字符串文字兼容。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM