如何将重复模式与 Java 正则表达式匹配？

Question

给定以下输入字符串3481.7.1071.html

我想确认

该字符串有 1 个或多个数字，后跟一个句点。
字符串以html 结尾。

最后，我想提取最左边的数字（即 3481）。

我当前的正则表达式几乎就在那里，但我无法捕获正确的组：

final Pattern p = Pattern.compile("(\\d++\\.)+html");   
final Matcher m = p.matcher("3481.7.1071.html");
if (m.matches()) {
    final String corrected = m.group(1)+"html"; // WRONG! Gives 1071.html
}

如何捕捉第一场比赛？

Answer 1

你可以把它分解出来：

(\d+\.)(\d+\.)*html

Answer 2

"^(\\d+)\\.(\\d+\\.)*html$"

Answer 3

groovy:000> p = java.util.regex.Pattern.compile("(\\d+).*") 
===> (\d+).*
groovy:000> m = p.matcher("3481.7.1071.html")
===> java.util.regex.Matcher[pattern=(\d+).* region=0,16 lastmatch=]
groovy:000> m.find()
===> true
groovy:000> m.group(1)+".html"
===> 3481.html
groovy:000>

Answer 4

是的你可以。

如果123.html和1.23html有效，请使用：

^(?:(\d+)\.).*?html$

如果123.html无效但1.23html有效，请使用：

^(?:(\d+)\.(?!h)).*?html$

如果123.html和1.23html无效但只有1.23.html有效，请使用：

^(?:(\d+)\.).*?\.html$

Answer 5

Java 样式： "(\\d+)\\..*?\\.html$"

这将 1) 获取第一组连续数字，2) 在单词之后需要一个点，3) 跳过除 3) 文字字符串“.html”之外的所有内容。

如果您的意思是“一个或多个 [组] 数字后跟一个句点”，那么这更符合您的要求。

"(\\d+)(?:\\.\\d+)*\\.html$"

这样你得到一个数字而不是点。 并且不需要捕获任何其他模式，所以它们不是。

Answer 6

jpalecek 的解决方案失败了； 它捕获最右边的数字。 原始海报更接近，但他得到了最右边的数字。 要获得最左边的数字，请忽略第一个点之后的任何内容：

[^\d]*(\d+)\..*html

[^\d]* 忽略最左边数字之前的所有内容（因此 X1.html 捕获数字 1）（\d+）。 捕获第一个数字，如果它们后跟一个点。 .* 忽略点和最终 html 之间的所有内容。

如何将重复模式与 Java 正则表达式匹配？

问题描述

6 个解决方案

解决方案1
7 2009-04-02 09:21:21

解决方案2
3 2009-04-02 09:54:15

解决方案3
0 2012-08-31 14:11:35

解决方案4
0 2012-08-31 14:38:50

解决方案5
0 2009-04-02 16:57:05

解决方案6
-1 2009-04-02 09:56:39

如何将重复模式与 Java 正则表达式匹配？

问题描述

6 个解决方案

解决方案1 7 2009-04-02 09:21:21

解决方案2 3 2009-04-02 09:54:15

解决方案3 0 2012-08-31 14:11:35

解决方案4 0 2012-08-31 14:38:50

解决方案5 0 2009-04-02 16:57:05

解决方案6 -1 2009-04-02 09:56:39

解决方案1
7 2009-04-02 09:21:21

解决方案2
3 2009-04-02 09:54:15

解决方案3
0 2012-08-31 14:11:35

解决方案4
0 2012-08-31 14:38:50

解决方案5
0 2009-04-02 16:57:05

解决方案6
-1 2009-04-02 09:56:39