繁体   English   中英

Java-使用Regex从文档中提取数据

[英]Java - Extract data from Document with Regex

我有一个简历的数据集,我想从每个简历中提取数据,我将举一个示例作为我需要的示例

String test= "Worked in Innovision Information System Private Limited as Project Trainee-Content Writing from Date to Date.";

我想提取company namerole (designation)Date (From-to)

我是regex的新手,所以如果我输入错了,请更正我

我尝试分别提取每个对象的第一件事

String regexStr5="Worked in:? \\w+" ;
String regexStr6 ="as:? ([a-zA-Z ]+)";  

以及日期Date : (Jan|Feb|Mar|Apr|May|Jun|Jul|Aug|Sep|Oct|Nov|Dec) \\d{1,2}, \\d{4}

我如何将它们全部放在同一个正则表达式中? 并打印company-Name +role+date

对于上面的测试字符串,文字字符串匹配就可以了。

正则表达式: Worked in (.*) as (.*) from (.*) to (.*).

替换操作: Company Name: \\1\\nRole (designation): \\2\\nDate: \\3 to \\4

Regex101演示

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM