簡體   English   中英

需要一個可以驗證帶有特殊字符(連字符、撇號等...)的名稱的 python 正則表達式

[英]Need a python regular expression that can verify names with special characters(Hyphens, apostrophes, etc...)

我正在嘗試創建一個可以匹配任何名稱的 python 正則表達式。 我正在抓取一個網頁並尋找<h1>標簽並在它之間抓取名稱。 這些名字可以包括James Dean、James-Dean、Brian O'Quin、Jame Joe-Harden等......

這是我一直在使用的第一個正則表達式,但它沒有捕捉到所有的名字

<h1>[A-Z]{1}[a-z]+\s[A-Z]{1}[']?[A-Z]?[-]?[A-Z]?[a-z]+

也許這個:

<h1>(([-'\w]+\s?)+)<h1>

解釋:

-匹配自身, \\w匹配字母和數字,加號是捕獲這些事件中的一個或多個。 此外,在此之后的空格字符是可選的,以支持組合名稱。
最后,最后一個+ plus 確保您可以重復我剛剛描述的結構。
希望這有幫助。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM