String的matches（）方法的奇怪行為

Question

我遇到了一個關於String的匹配（RegExp）方法的有趣問題。

assertTrue("33CCFF".matches("[0-9A-Za-z]{6}"));
assertTrue("CC33FF".matches("[0-9A-Za-z]{6}"));
assertTrue("CC3355".matches("[0-9A-Za-z]{6}"));
assertTrue("CC9955".matches("[0-9A-Za-z]{6}"));
assertTrue("CC3366".matches("[0-9A-Za-z]{6}"));
assertTrue("CC3965".matches("[0-9A-Za-z]{6}"));
assertTrue("CC1961".matches("[0-9A-Za-z]{6}"));
assertTrue("CC9999".matches("[0-9A-Za-z]{6}"));
assertTrue("СС3966".matches("[0-9A-Za-z]{6}")); // failing
assertTrue("СС9965".matches("[0-9A-Za-z]{6}")); // failing
assertTrue("СС9966".matches("[0-9A-Za-z]{6}")); // failing

最后3個斷言意外失敗。 我找不到為什么會發生這種奇怪的行為的原因。 你有同樣的問題嗎？ 你有什么想法？

順便說一下，如果被問到，我的java版本如下。

java version "1.6.0_26"
Java(TM) SE Runtime Environment (build 1.6.0_26-b03)
Java HotSpot(TM) 64-Bit Server VM (build 20.1-b02, mixed mode)

Answer 1

最后三個實際上並不是以ASCII“C”字符開頭。 它們以非ASCII字符開頭， 看起來像“C”。 這與[0-9A-Za-z]集合中的任何內容都不匹配，因此模式失敗。

（我通過將代碼復制並粘貼到文本編輯器中來發現這一點，該文本編輯器不能很好地處理非ASCII字符 - 它們以“？”形式出現。）

Answer 2

你的“СС3966”（我正在剪切和粘貼）被標記為非UTF-8，這就是為什么reg-ex與它們不匹配的原因。 當我更改您的文本並自己鍵入它時，它按預期工作。 不確定從哪里復制這些值，但那是你的問題

String的matches（）方法的奇怪行為

問題描述

2 個解決方案

解決方案1
15 已采納 2011-10-05 16:25:28

解決方案2
2 2011-10-05 16:29:01

String的matches（）方法的奇怪行為

問題描述

2 個解決方案

解決方案1 15 已采納 2011-10-05 16:25:28

解決方案2 2 2011-10-05 16:29:01

解決方案1
15 已采納 2011-10-05 16:25:28

解決方案2
2 2011-10-05 16:29:01