[英]Java: Using Regular Expressions to Extract various number of values in a String
我想编写一个函数,根据正则表达式模式从String中提取不同数量的值:
这是我的功能代码:
/**
* Get substrings in a string using groups in regular expression.
*
* @param str
* @param regex
* @return
*/
public static String[] regexMatch(String str, String regex) {
String[] rtn = null;
if (str != null && regex != null) {
Pattern pat = Pattern.compile(regex);
Matcher matcher = pat.matcher(str);
if (matcher.find()) {
int nGroup = matcher.groupCount();
rtn = new String[nGroup];
for (int i = 0; i < nGroup; i++) {
rtn[i] = matcher.group(i);
}
}
}
return rtn;
}
当我使用以下方法测试时:
String str = "nets-(90000,5,4).dat";
String regex = "(\\d+),(\\d+),(\\d+)";
String[] rtn = regexMatch(str, regex);
我明白了:
rtn: [90000,5,4,90000,5]
我怎么能像我预期的那样得到rtn [90000,5,4]?
您的阵列当前存储
[0] -> 90000,5,4
[1] -> 90000
[2] -> 5
这就是为什么你看到输出[90000,5,4,90000,5]
。 这是因为group(0)
表示整个匹配,因此它返回90000,5,4
。
你需要的是第1,2和3组的匹配。
(\\d+),(\\d+),(\\d+)
1 2 3
所以改变
rtn[i] = matcher.group(i);
至
rtn[i] = matcher.group(i+1);
首先,我将以1开始for循环,这样你就可以得到你在正则表达式中声明的分组。 循环应如下所示:
for (int i = 1; i <= nGroup; i++) {
rtn[i] = matcher.group(i);
}
已知组0是正则表达式的完整匹配字符串。 分组来自:
String regex = "(\\d+),(\\d+),(\\d+)";
你会说matcher.group(1),matcher.group(2)和matcher.group(3)会给你你想要的东西。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.