簡體   English   中英

python正則表達式:匹配列出的子字符串之一

[英]python regular expression : match one of listed substrings

假設我要檢索以.com.fr結尾但不以.edu結尾的網站地址。 這是我的嘗試,顯然不起作用:

import re
text="www.cool.fr www.ham.edu www.stanford.com www.hack.ru"
re.findall(ur"\S+\.[com|fr]",text)

我想它可能存在一些我不了解的正則表達式,以便以一種優雅的方式解決此問題。 提前致謝。

您正則表達式使用字符類 [...]哪里| 匹配文字| 符號,它不是交替運算符。 [com|fr]類與com|匹配| fr字符。

您需要使用一個組,並確保在com或fr之后有一個單詞邊界:

import re
text="www.cool.fr www.ham.edu www.stanford.com www.hack.ru"
print(re.findall(r"\S+\.(?:com|fr)\b",text))
# => ['www.cool.fr', 'www.stanford.com']

IDEONE演示

正則表達式匹配:

  • \\S+\\. -1個或多個非空白符號,后跟一個literal .
  • (?:com|fr) -一個非0捕獲組,匹配2個替代方案: comfr ,后跟...
  • \\b單詞邊界。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM