在Java中重复正则表达式模式

Question

我想读取一个包含以下内容的文本文件，我正在尝试使用正则表达式来匹配内容并将内容拆分为2个优先级队列的不同字符串，以制作基于堆的优先级队列任务调度程序。但是首先，我需要确保格式正确无误，该格式是我使用扫描仪读取的文本文件的格式，该格式以包含字母数字字母的任务开头，后跟一个非负整数（到达时间）和一个自然数（截止时间）。 以下是文本文件中格式正确的输入：

task1 2 3 task2 2 3 task3 2 3 task4 4 5 task5 4 5
task6 7 9 task7 7 9 task8 7 9 task9 7 9
task10 7 9 task11 7 9 task12 7 9 task13 7 9
task14 7 9 task15 7 9 task16 10 11 task17 10 11
task18 10 11 task19 10 11  task20 10 12

我尝试了以下正则表达式代码来尝试检查格式是否正确，但是我只能将其与第一个任务属性进行匹配。 我似乎无法在第一个任务之外匹配它，这意味着当它继续到其他重复格式的任务时，则正则表达式将失败。 知道我的正则表达式有什么问题吗？

(^\s*[a-zA-Z0-9]*\s+\d+\s+\d+\s*){1,}

^以任意空格\\s* 0次或多次

[a-zA-Z0-0]*是0或更多次的字母数字，表示任务

\\s+是不同任务属性之间的空白

\\d+是到达时间和截止时间

\\s*在不同任务之间以空格结束0次或更多次

方括号()后面的{1,}指定最小重复次数为1，最大重复次数没有指定次数

Answer 1

问题是^ ，它要求匹配项位于输入序列的开头，并且除第一个匹配项外的任何匹配项都不满足该条件。

尝试将第一部分移出组：

^\s*([a-zA-Z0-9]*\s+\d+\s+\d+\s*){1,}

顺便说一句， {1,}可以用单个+代替。

还要注意，根据您应用正则表达式的方式，您可能不需要用^和$来包装表达式（例如，隐式执行^和String.matches()或Matcher.matches ），或者您可能必须这样做（取决于您的需求），例如，在末尾添加$ ，以要求匹配后不包含任何内容（如果这样做会违反您的文件格式）。

如果还想提取匹配项，则需要稍微不同的方法，即使用Matcher.find()并删除最后一部分（ {1,} ）。

在Java中重复正则表达式模式

问题描述

1 个解决方案

解决方案1
2 已采纳 2015-10-05 07:06:37

在Java中重复正则表达式模式

问题描述

1 个解决方案

解决方案1 2 已采纳 2015-10-05 07:06:37

解决方案1
2 已采纳 2015-10-05 07:06:37