正則表達式+ Python：如何用'？'查找字符串在里面？

Question

我在content變量中有一個多行字符串，我需要檢索包含問號的模式uri所有匹配項。

這是我到目前為止：

content = """
/blog:text:Lorem ipsum dolor sit amet, consectetur adipisicing elit
<break>
text:Duis aute irure dolor in reprehenderit in voluptate velit esse cillum dolore
<break>
text:Excepteur sint occaecat cupidatat non proident, sunt in culpa qui officia.

/blog?page=1:text:Lorem ipsum dolor sit amet, consectetur adipisicing elit
<break>
text:Duis aute irure dolor in reprehenderit in voluptate velit esse cillum dolore
<break>
text:Excepteur sint occaecat cupidatat non proident, sunt in culpa qui officia.
"""

#uri = '/blog' # Works fine
uri = '/blog?page=1'
re.findall('^(?ism)%s?:(.*?)(\n\n)' % uri, content)

它工作正常，直到uri得到? 用它后的參數，我得到空列表。

任何想法如何修復正則表達式？

Answer 1

Python的re.escape()是你的朋友。 如果你不使用它， ? 在uri內部使用其在正則表達式中的通常含義（使前一項為0或1匹配）。

uri = '/blog?page=1'
re.findall('^(?ism)%s?:(.*?)(\n\n)' % re.escape(uri), content)

我不清楚你究竟想要什么?:在%s之后做什么，所以我將它留在可能錯誤的假設中，因為它存在於某個原因。

Answer 2

我會保持簡單並找到可能的匹配，然后過濾掉那些包含? ，例如：

import re

candidates = (m.group(1) for m in re.finditer('^(.*?):', content, flags=re.M))
matches = [m for m in candidates if '?' in m]
# ['/blog?page=1']

Answer 3

我沒有看到你的兩個新行content 。 還有，我逃過了? 來自uri，因為它是正則表達式的角色。

uri = '/blog\?page=1'
re.findall('^(?ism)%s?:(.*?)[\n\r]' % uri, content)

正則表達式+ Python：如何用'？'查找字符串在里面？

問題描述

3 個解決方案

解決方案1
1 已采納 2014-03-10 17:51:03

解決方案2
1 2014-03-10 17:55:06

解決方案3
0 2014-03-10 17:50:55

正則表達式+ Python：如何用&#39;？&#39;查找字符串 在里面？

問題描述

3 個解決方案

解決方案1 1 已采納 2014-03-10 17:51:03

解決方案2 1 2014-03-10 17:55:06

解決方案3 0 2014-03-10 17:50:55

正則表達式+ Python：如何用'？'查找字符串在里面？

解決方案1
1 已采納 2014-03-10 17:51:03

解決方案2
1 2014-03-10 17:55:06

解決方案3
0 2014-03-10 17:50:55