簡體   English   中英

UTF-8語言的正則表達式

[英]Regular expression for UTF-8 language

我的應用程序還支持旁遮普語(\\ u0A00- \\ u0A7F)我嘗試了以下代碼

Pattern classPattern = Pattern.compile("\u0A00-\u0A7F ");
    Matcher classMatcher = classPattern.matcher("ਭਾਸ਼ਾ ਸੰਦ");
            if (classMatcher.find()) {
              System.out.println("yes");
            }else{
                System.out.println("no");
            }

我在matcher()中提供了旁遮普字符,但輸出卻是“ no”

知道為什么嗎?

該模式應該是"[\਀-\੿ ]"嗎? 在我看來,您正在嘗試按特定順序匹配四個字符,但給匹配器六個字符作為輸入。

[\u0A00-\u0A7F ]*

沒有星號,您將只匹配一個字符。 您可以將*替換為+ ,然后將不接受空字符串。

看一下Pattern類JavaDocs 很好,快速地了解正則表達式非常有用。

因為“ asdsa”不是旁遮普語(您提供的模式將查找pubjabi字符,因此不是dn abc)

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM