[英]repeating regex pattern in java
我想读取一个包含以下内容的文本文件,我正在尝试使用正则表达式来匹配内容并将内容拆分为2个优先级队列的不同字符串,以制作基于堆的优先级队列任务调度程序。 但是首先,我需要确保格式正确无误,该格式是我使用扫描仪读取的文本文件的格式,该格式以包含字母数字字母的任务开头,后跟一个非负整数(到达时间)和一个自然数(截止时间)。 以下是文本文件中格式正确的输入:
task1 2 3 task2 2 3 task3 2 3 task4 4 5 task5 4 5
task6 7 9 task7 7 9 task8 7 9 task9 7 9
task10 7 9 task11 7 9 task12 7 9 task13 7 9
task14 7 9 task15 7 9 task16 10 11 task17 10 11
task18 10 11 task19 10 11 task20 10 12
我尝试了以下正则表达式代码来尝试检查格式是否正确,但是我只能将其与第一个任务属性进行匹配。 我似乎无法在第一个任务之外匹配它,这意味着当它继续到其他重复格式的任务时,则正则表达式将失败。 知道我的正则表达式有什么问题吗?
(^\s*[a-zA-Z0-9]*\s+\d+\s+\d+\s*){1,}
^
以任意空格\\s*
0次或多次
[a-zA-Z0-0]*
是0或更多次的字母数字,表示任务
\\s+
是不同任务属性之间的空白
\\d+
是到达时间和截止时间
\\s*
在不同任务之间以空格结束0次或更多次
方括号()
后面的{1,}
指定最小重复次数为1,最大重复次数没有指定次数
问题是^
,它要求匹配项位于输入序列的开头,并且除第一个匹配项外的任何匹配项都不满足该条件。
尝试将第一部分移出组:
^\s*([a-zA-Z0-9]*\s+\d+\s+\d+\s*){1,}
顺便说一句, {1,}
可以用单个+
代替。
还要注意,根据您应用正则表达式的方式,您可能不需要用^
和$
来包装表达式(例如,隐式执行^
和String.matches()
或Matcher.matches
),或者您可能必须这样做(取决于您的需求),例如,在末尾添加$
,以要求匹配后不包含任何内容(如果这样做会违反您的文件格式)。
如果还想提取匹配项,则需要稍微不同的方法,即使用Matcher.find()
并删除最后一部分( {1,}
)。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.