繁体   English   中英

在Java中使用Regex分割复杂字串

[英]Split complex string with Regex in JAVA

我想用JAVA中的Regex将以下字符串拆分为一个数组,但我不知道该怎么做。

string1="advmod(likes-4, also-3)"  ==>    advmod, likes, also
string2="nsubj(likes-4, dog24-2)"  ==>    bsubj, likes, dog24
string3="num(dog24-3, 8-2)"        ==>    num, dog24, 8

请帮我做这项工作? 如何将字符串“ num(dog24-3,8-2)”分成三个标记numdog248 ,然后将它们放入字符串数组。

非常感谢。

这是通用的:

String string[] = {"advmod(likes-4, also-3)",// ==> advmod , likes , also
        "nsubj(likes-4, dog24-2)",// ==> bsubj , likes , dog24
        "num(dog24-3, 8-2)"};//==> num ,dog24 , 8
Pattern p = Pattern.compile("(\\w+)\\(([^-]+).*, ([^-]+)");
for (int i = 0; i < string.length; i++) {
    Matcher m = p.matcher(string[i]);
    while(m.find()) {
        System.out.print(i+": ");
        for(int j=1; j<= m.groupCount(); j++){
            System.out.print(m.group(j));
            if(j!=m.groupCount()) {
                System.out.print(", ");
            }
        }
        System.out.println("");
    }
}

希望这对我有帮助。

这是输出:

0: advmod, likes, also
1: nsubj, likes, dog24
2: num, dog24, 8

对于第三弦

  String re1="(num)";   // Word 1
    String re2=".*?";   // Non-greedy match on filler
    String re3="(dog24)";   // Alphanum 1
    String re4=".*?";   // Non-greedy match on filler
    String re5="(8)";   // Integer Number 1

    Pattern p = Pattern.compile(re1+re2+re3+re4+re5,Pattern.CASE_INSENSITIVE | Pattern.DOTALL);
    Matcher m = p.matcher(txt);
    if (m.find())
    {
        String word1=m.group(1);
        String alphanum1=m.group(2);
        String int1=m.group(3);
        System.out.print("("+word1.toString()+")"+"("+alphanum1.toString()+")"+"("+int1.toString()+")"+"\n");
    }

如果要拆分,可以使用以下方法:

str.split("\\(|-[0-9]+(?:,\\s+|\\))");

ideone演示

您确实没有描述语法,但是假设它看起来像Java方法或Prolog语句,请尝试

final static String TOKEN_CHARACTERS="[\w\d-]"
final Pattern p = Pattern.compile("^(" + TOKEN_CHARACTERS + "+)\((" + TOKEN_CHARACTERS + "+,\s*(" + TOKEN_CHARACTERS + ")\)$";

然后在-上分割; 我认为它确实存在是有某种原因的,并且尚不清楚它是否始终存在(如果这样,您可以更改模式以对单个代码进行硬编码-而不是将其视为令牌的一部分)。 如果您留出更多空间,请相应地进行调整。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM