![](/img/trans.png)
[英]Python regex to match alpha characters only ([A-Za-z] but for Unicode)
[英]Can the [a-zA-Z] Python regex pattern be made to match and replace non-ASCII Unicode characters?
在下面的正則表達式中,我希望字符串中的每個字符都替換為“X”,但它不起作用。
在Python 2.7中:
>>> import re
>>> re.sub(u"[a-zA-Z]","X","dfäg")
'XX\xc3\xa4X'
要么
>>> re.sub("[a-zA-Z]","X","dfäg",re.UNICODE)
u'XX\xe4X'
在Python 3.4中:
>>> re.sub("[a-zA-Z]","X","dfäg")
'XXäX'
有可能以某種方式'配置'[a-zA-Z]模式以匹配'ä','ü'等? 如果無法做到這一點,我如何在方括號之間創建一個類似的字符范圍模式,包括通常的“完整字母”范圍內的Unicode字符? 我的意思是,例如,在像德語這樣的語言中,'ä'將被放置在字母表中接近'a'的某個位置,因此可以預期它將包含在'az'范圍內。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.