[英]Need a python regular expression that can verify names with special characters(Hyphens, apostrophes, etc...)
我正在嘗試創建一個可以匹配任何名稱的 python 正則表達式。 我正在抓取一個網頁並尋找<h1>
標簽並在它之間抓取名稱。 這些名字可以包括James Dean、James-Dean、Brian O'Quin、Jame Joe-Harden等......
這是我一直在使用的第一個正則表達式,但它沒有捕捉到所有的名字
<h1>[A-Z]{1}[a-z]+\s[A-Z]{1}[']?[A-Z]?[-]?[A-Z]?[a-z]+
也許這個:
<h1>(([-'\w]+\s?)+)<h1>
解釋:
-匹配自身, \\w匹配字母和數字,加號是捕獲這些事件中的一個或多個。 此外,在此之后的空格字符是可選的,以支持組合名稱。
最后,最后一個+ plus 確保您可以重復我剛剛描述的結構。
希望這有幫助。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.