繁体   English   中英

两个子串之间的Tinier字符串

[英]Tinier string between two substrings

我试图解析IRC日志,像这样:

2013-09-26T01:52:40  <Shan-x> some stuff

我想要伪,所以我用re

re.search('%s(.*)%s' % ('<', '>'), s).group(1)

但如果日志是这样的:

2013-09-26T01:52:40  <Shan-x> some stuff > foo bar

然后,我得到了这个: Shan-x> some stuff 我怎么解析只有伪?

你需要添加一个? .* 非贪婪? *量词:

re.search('%s(.*?)%s' % ('<', '>'), s).group(1)

现在了. 匹配满足模式的最小字符数,而不是默认的最大值。

不知道为什么你在这里使用字符串插值; 对于静态字符,只需使用:

re.search('<(.*?)>', s).group(1)

您还可以捕获与结束字符不匹配的所有字符:

re.search('<([^>]*)>', s).group(1)

这里[^>]形成一个匹配任何不在类中的字符的字符类; 所以任何一个不是>将有资格。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM