[英]Java regex unicode support?
我正在開發一個應用程序,該應用程序通過電子郵件接收來自客戶的有關特定產品的反饋。 目前,我正在使用Java Matcher和Pattern類來使用正則表達式來解析某些代碼片段和關鍵字。
給予:客戶從世界各地(亞太地區除外)的任何電子郵件客戶端給我們發送電子郵件。
問:我需要在我的所有正則表達式前加上\\\\p{L}
和/或\\\\p{M}
還是可以只使用
\\\\Q<my regex>\\\\E
(用\\\\Q
和\\\\E
包裹我的正則表達式)?
您可以嘗試:
Pattern.quote(yourString);
相當於\\Q
\\E
\\Q
... \\E
用於文字匹配,這意味着您需要事先知道要匹配的字符串。 例如,使用\\Qпривет мир\\E
將匹配:
привет мир
盡管使用\\Q.*\\E
不匹配-它將匹配:
.*
因此,如果您要匹配привет мир
或merhaba dünya
(兩者)之類的字符串,則需要使用\\p{M}*\\p{L}+
,它將捕獲每個單詞( привет
, мир
,等等)或\\X+
來捕獲整個字符串привет мир
。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.