繁体   English   中英

如何在python正则表达式中找到字符串的特定部分?

[英]How can i find specific part of string in python regular expression?

case1 = http:www.freejobalert.comupsc-advt-no-18337
case2 = http:www.freejobalert.comupsc-advt-no-1833742
job_id = (''.join(re.findall(r'\d{7}:\d{5}',case1,re.I)))

我如何使用正则表达式从上述字符串中仅找到33742。 该数字可能是5或7个字符。

问题是您不是在使用“ or”( | ),而是冒号。 尝试使用:

\d{7}|\d{5}

它应该在您的字符串中返回数字。

您也可以尝试使用\\d{5,7}类的东西,意思是5到7(含)之间的数字。

job_id = (''.join(re.search(r'(\\d{5,7})',case1,re.I)))

默认行为是贪婪,这意味着它将匹配5到7位之间的尽可能多的数字。

编辑(另一个选项可能更容易理解,但会做同样的事情):

job_id = re.search(r'(\\d{5,7})',case1).group(1)

前面提到的两个答案都是解决您的问题的方法,我得出如下结论:

>>> import re
>>> case1 = "http:www.freejobalert.comupsc-advt-no-18337"
>>> case2 = "http:www.freejobalert.comupsc-advt-no-1833742"
>>> job_id1 = (''.join(re.findall(r'\d{5,7}',case1,re.I)))
>>> job_id2 = (''.join(re.findall(r'\d{5,7}',case2,re.I)))
>>> job_id1
'18337'
>>> job_id2
'1833742'

>>> job_id3 = (''.join(re.findall(r'\d{5}|\d{7}',case1,re.I)))
>>> job_id4 = (''.join(re.findall(r'\d{5}|\d{7}',case2,re.I)))
>>> job_id3
'18337'
>>> job_id4
'18337'

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM