[英]How can i find specific part of string in python regular expression?
case1 = http:www.freejobalert.comupsc-advt-no-18337
case2 = http:www.freejobalert.comupsc-advt-no-1833742
job_id = (''.join(re.findall(r'\d{7}:\d{5}',case1,re.I)))
我如何使用正则表达式从上述字符串中仅找到33742。 该数字可能是5或7个字符。
问题是您不是在使用“ or”( |
),而是冒号。 尝试使用:
\d{7}|\d{5}
它应该在您的字符串中返回数字。
您也可以尝试使用\\d{5,7}
类的东西,意思是5到7(含)之间的数字。
job_id = (''.join(re.search(r'(\\d{5,7})',case1,re.I)))
默认行为是贪婪,这意味着它将匹配5到7位之间的尽可能多的数字。
编辑(另一个选项可能更容易理解,但会做同样的事情):
job_id = re.search(r'(\\d{5,7})',case1).group(1)
前面提到的两个答案都是解决您的问题的方法,我得出如下结论:
>>> import re
>>> case1 = "http:www.freejobalert.comupsc-advt-no-18337"
>>> case2 = "http:www.freejobalert.comupsc-advt-no-1833742"
>>> job_id1 = (''.join(re.findall(r'\d{5,7}',case1,re.I)))
>>> job_id2 = (''.join(re.findall(r'\d{5,7}',case2,re.I)))
>>> job_id1
'18337'
>>> job_id2
'1833742'
>>> job_id3 = (''.join(re.findall(r'\d{5}|\d{7}',case1,re.I)))
>>> job_id4 = (''.join(re.findall(r'\d{5}|\d{7}',case2,re.I)))
>>> job_id3
'18337'
>>> job_id4
'18337'
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.