[英]Python regex named group (0 or 1 match)
我正在尝试解析以下行Python:
s='SIP/200259 (In use) has taken 6 calls (last was 8932 secs ago) (order: 0)'
因此,我制作了我的正则表达式:
sip_patt = re.compile(r'''SIP/(?P<ext>\d+).* # Extension
(?P<inuse>In\suse).* # Speaking
has\staken\s(?P<taken>\d+|no).* # Taken
last\swas\s(?P<last>\d+).* # Last Seen
order:\s(?P<order>\d+).* # Order in the queue''', re.X)
这样会产生期望的结果:
sip_patt.match(s).groups()
('200259', 'In use', '6', '8932', '0')
但是,有时初始字符串可能显示如下(在括号中请注意“未使用”):
s='SIP/200259 (Not in use) has taken 6 calls (last was 8932 secs ago) (order: 0)'
因此,为了避免所有“ if”和“ elses”,我想稍微更改捕获逻辑以匹配命名组“ inuse”的0或1个实例,但是这根本行不通。 通过增加 ”?” 或{0,1}在我的命名组旁边,我总是找不到匹配项:
s='SIP/200259 (In use) has taken 6 calls (last was 8932 secs ago) (order: 0)'
sip_patt = re.compile(r'''SIP/(?P<ext>\d+).* # Extension
(?P<inuse>In\suse)?.* # Speaking
has\staken\s(?P<taken>\d+|no).* # Taken
last\swas\s(?P<last>\d+).* # Last Seen
order:\s(?P<order>\d+).* # Order in the queue''', re.X)
sip_patt.match(s).groups()
('200259', None, '6', '8932', '0')
我想念什么?
你想念什么?
.*
是非常危险的元序列。 它很贪婪,尝试匹配尽可能多的字符。
那就是你写的时候
SIP/(?P<ext>\\d+).*
.*
将匹配括号中的任何内容,包括(In use)
。 因为(?P<inuse>In\\suse)?
是一个可选字段,正则表达式计算机在上一个.*
包括此字段.*
如何改正
您可以限制哪些遵循SIP digits
与实例很显然, In use
与开始(
因此而不是匹配任何东西.*
我们将尝试像[^(]
这将匹配之外的其他任何东西(
这确保了仅匹配最多(
和In use
中安全匹配(?P<inuse>In\\suse)?
例:
>>> sip_patt = re.compile(r'''SIP/(?P<ext>\d+)[^(]* # Extension
... \((?P<inuse>In\suse)?\).* # Speaking
... has\staken\s(?P<taken>\d+|no).* # Taken
... last\swas\s(?P<last>\d+).* # Last Seen
... order:\s(?P<order>\d+).* # Order in the queue''', re.X)
>>> sip_patt.match(s).groups()
('200259', 'In use', '6', '8932', '0')
注意我限制了?P<inuse>In\\suse)?
在\\( \\)
,以使其与安全性相匹配
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.