簡體   English   中英

如何在python正則表達式中找到字符串的特定部分?

[英]How can i find specific part of string in python regular expression?

case1 = http:www.freejobalert.comupsc-advt-no-18337
case2 = http:www.freejobalert.comupsc-advt-no-1833742
job_id = (''.join(re.findall(r'\d{7}:\d{5}',case1,re.I)))

我如何使用正則表達式從上述字符串中僅找到33742。 該數字可能是5或7個字符。

問題是您不是在使用“ or”( | ),而是冒號。 嘗試使用:

\d{7}|\d{5}

它應該在您的字符串中返回數字。

您也可以嘗試使用\\d{5,7}類的東西,意思是5到7(含)之間的數字。

job_id = (''.join(re.search(r'(\\d{5,7})',case1,re.I)))

默認行為是貪婪,這意味着它將匹配5到7位之間的盡可能多的數字。

編輯(另一個選項可能更容易理解,但會做同樣的事情):

job_id = re.search(r'(\\d{5,7})',case1).group(1)

前面提到的兩個答案都是解決您的問題的方法,我得出如下結論:

>>> import re
>>> case1 = "http:www.freejobalert.comupsc-advt-no-18337"
>>> case2 = "http:www.freejobalert.comupsc-advt-no-1833742"
>>> job_id1 = (''.join(re.findall(r'\d{5,7}',case1,re.I)))
>>> job_id2 = (''.join(re.findall(r'\d{5,7}',case2,re.I)))
>>> job_id1
'18337'
>>> job_id2
'1833742'

>>> job_id3 = (''.join(re.findall(r'\d{5}|\d{7}',case1,re.I)))
>>> job_id4 = (''.join(re.findall(r'\d{5}|\d{7}',case2,re.I)))
>>> job_id3
'18337'
>>> job_id4
'18337'

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM