UTF-8語言的正則表達式

Question

我的應用程序還支持旁遮普語（\\ u0A00- \\ u0A7F）我嘗試了以下代碼

Pattern classPattern = Pattern.compile("\u0A00-\u0A7F ");
    Matcher classMatcher = classPattern.matcher("ਭਾਸ਼ਾ ਸੰਦ");
            if (classMatcher.find()) {
              System.out.println("yes");
            }else{
                System.out.println("no");
            }

我在matcher（）中提供了旁遮普字符，但輸出卻是“ no”

知道為什么嗎？

Answer 1

該模式應該是"[\਀-\੿ ]"嗎？ 在我看來，您正在嘗試按特定順序匹配四個字符，但給匹配器六個字符作為輸入。

Answer 2

[\u0A00-\u0A7F ]*

沒有星號，您將只匹配一個字符。 您可以將*替換為+ ，然后將不接受空字符串。

看一下Pattern類JavaDocs 。 很好，快速地了解正則表達式非常有用。

Answer 3

因為“ asdsa”不是旁遮普語（您提供的模式將查找pubjabi字符，因此不是dn abc）

UTF-8語言的正則表達式

問題描述

3 個解決方案

解決方案1
6 已采納 2011-01-13 10:17:14

解決方案2
3 2011-01-13 10:25:32

解決方案3
1 2011-01-13 10:16:40

UTF-8語言的正則表達式

問題描述

3 個解決方案

解決方案1 6 已采納 2011-01-13 10:17:14

解決方案2 3 2011-01-13 10:25:32

解決方案3 1 2011-01-13 10:16:40

解決方案1
6 已采納 2011-01-13 10:17:14

解決方案2
3 2011-01-13 10:25:32

解決方案3
1 2011-01-13 10:16:40