[英]Java Regex matching whole word containing special characters
我正在尝试匹配字符串文本中的某些关键字。 关键字可以包含特殊字符的任意组合,并且必须是一个完整的单词(无空格)。
public static void main(String[] args)
{
String words[] = {"Hello", "World", "£999.00", "*&332", "$30,00", "$1230.30",
"Apple^*$Banana&$Pears!$", "90.09%"};
String text = "Hello world World £99900 £999.00 Apple^*$Banana&$Pears!$"
+ " $30,00 *&332 $1230.30 90.09%";
StringBuilder regex = new StringBuilder();
regex.append("(");
for(String item : word)
regex.append("(?:^|\\s)").append(item).append("(?:$|\\s)").append("|");
regex.deleteCharAt(buildRegex.length() - 1);
regex.append(")");
Pattern pattern = Pattern.compile(regex.toString());
Matcher match = pattern.matcher(text);
while (match.find())
System.out.println(match.group());
}
我得到的结果是:
你好
世界
£999.00
&332
90.09%
并非所有单词都匹配。 我尝试了这里发布的其他解决方案,搜索和non可以匹配示例中的所有单词。
如何匹配包含特殊字符组合的关键字?
这种基于lookaround
的正则表达式应该可以工作:
for(String item : words)
regex.append("(?<=^|\\s)").append(Pattern.quote(item)).append("(?=\\s|$)").append("|");
主要区别在于:
Pattern.quote
照顾特殊字符 得到输出:
Hello
World
£999.00
Apple^*$Banana&$Pears!$
$30,00
*&332
$1230.30
90.09%
使用Pattern.quote()
。 更重要的是,您需要使用先行式和后行式:
for(String item : word)
regex.append("(?<=^|\\s)")
.append(Pattern.quote(item)) // HERE
.append("(?=$|\\s)").append("|");
基本上,此方法的作用是在字符串前面加上\\Q
并附加\\E
参见javadoc中的Pattern
。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.