需要一個可以驗證帶有特殊字符（連字符、撇號等...）的名稱的 python 正則表達式

Question

我正在嘗試創建一個可以匹配任何名稱的 python 正則表達式。 我正在抓取一個網頁並尋找<h1>標簽並在它之間抓取名稱。 這些名字可以包括James Dean、James-Dean、Brian O'Quin、Jame Joe-Harden等......

這是我一直在使用的第一個正則表達式，但它沒有捕捉到所有的名字

<h1>[A-Z]{1}[a-z]+\s[A-Z]{1}[']?[A-Z]?[-]?[A-Z]?[a-z]+

Answer 1

也許這個：

<h1>(([-'\w]+\s?)+)<h1>

解釋：

-匹配自身， \\w匹配字母和數字，加號是捕獲這些事件中的一個或多個。 此外，在此之后的空格字符是可選的，以支持組合名稱。
最后，最后一個+ plus 確保您可以重復我剛剛描述的結構。
希望這有幫助。