String的matches（）方法的奇怪行为

Question

我遇到了一个关于String的匹配（RegExp）方法的有趣问题。

assertTrue("33CCFF".matches("[0-9A-Za-z]{6}"));
assertTrue("CC33FF".matches("[0-9A-Za-z]{6}"));
assertTrue("CC3355".matches("[0-9A-Za-z]{6}"));
assertTrue("CC9955".matches("[0-9A-Za-z]{6}"));
assertTrue("CC3366".matches("[0-9A-Za-z]{6}"));
assertTrue("CC3965".matches("[0-9A-Za-z]{6}"));
assertTrue("CC1961".matches("[0-9A-Za-z]{6}"));
assertTrue("CC9999".matches("[0-9A-Za-z]{6}"));
assertTrue("СС3966".matches("[0-9A-Za-z]{6}")); // failing
assertTrue("СС9965".matches("[0-9A-Za-z]{6}")); // failing
assertTrue("СС9966".matches("[0-9A-Za-z]{6}")); // failing

最后3个断言意外失败。 我找不到为什么会发生这种奇怪的行为的原因。 你有同样的问题吗？ 你有什么想法？

顺便说一下，如果被问到，我的java版本如下。

java version "1.6.0_26"
Java(TM) SE Runtime Environment (build 1.6.0_26-b03)
Java HotSpot(TM) 64-Bit Server VM (build 20.1-b02, mixed mode)

Answer 1

最后三个实际上并不是以ASCII“C”字符开头。 它们以非ASCII字符开头， 看起来像“C”。 这与[0-9A-Za-z]集合中的任何内容都不匹配，因此模式失败。

（我通过将代码复制并粘贴到文本编辑器中来发现这一点，该文本编辑器不能很好地处理非ASCII字符 - 它们以“？”形式出现。）

Answer 2

你的“СС3966”（我正在剪切和粘贴）被标记为非UTF-8，这就是为什么reg-ex与它们不匹配的原因。 当我更改您的文本并自己键入它时，它按预期工作。 不确定从哪里复制这些值，但那是你的问题

String的matches（）方法的奇怪行为

问题描述

2 个解决方案

解决方案1
15 已采纳 2011-10-05 16:25:28

解决方案2
2 2011-10-05 16:29:01

String的matches（）方法的奇怪行为

问题描述

2 个解决方案

解决方案1 15 已采纳 2011-10-05 16:25:28

解决方案2 2 2011-10-05 16:29:01

解决方案1
15 已采纳 2011-10-05 16:25:28

解决方案2
2 2011-10-05 16:29:01