繁体   English   中英

在Java中使用正则表达式替换字符组

[英]Replacing group of characters using regular expression in Java

我有一个像这样的字符串:

<b.*?n.*? .*?a.*?n.*? .*?e.*?&nbsp;.*? .*? .*? .e.*?t.*?e.*?   .*?   .*? .*? .*?<.r>.*? .*?e.*? .*? .*? .*?l.*?e .*?b.*?e.*?n.*?b.*? .*?  .*?a.*?p.*?t.*? .*?l.*? .*? .*? .*? .*? ..b.*? .*? .*?s.*?   .*?s.*?   .*?>.*? .*?es.*? .*?n.*?t.*?r.*? .*? .*? .*? .n.*?b.*? .*? .*? .*? .*? .*?e.*? .*? .*? .*? .*?t.*?n.*? .*? .*? .*? .*?n.s.. .*?a. .*? <.*?e.e.*? comp.*? .*?<.*? .*?r.*?el.*?&.*?b.*? .*? .*?y.*? ..e.*? .. .*? .*? .*? .*? .*?u.t.*?m..o.*?b.*?r.*?e.*?n.*?o.. .*? .*?s. .*?e.*?o.. .*?r.*?r.*?&.*?b.*? ..b>.*?o.*?s.*? .*?r.*? .*? .*?a..i.*? .*? .*? .*?e.*?in.*? .*? .*? .*? .*? .*? .*? ..b.*? .*? .*? .*?r..i.*?c.*? .*? .*?o.*?<..>.*?

抱歉, *已从上面的文本中删除。

我希望能够替换连续出现的.*? 成一个.*? 我试过了

res = tmp.replaceAll("(\\s\\.\\*\\?)(\\1{2,})","\\s\\.\\*\\?");

但它没有用。 我的代码有问题吗?

我建议您使用循环并替换它。 像跟随

        String pattern= "(.\*\?\s.\*\?)";
        if(YOURSTRING.matches(pattern)){
            // replace two .*? to one 
        }
        else{ 
            // break your loop   
            }

这不是一个完整的解决方案。 但是一些基本的想法

您可以尝试以下方法:

str.replaceAll("\\p{Blank}+", "").replaceAll("[\\.\\*\\?]+", ".*?");

例:

String str = "abcabcddabceeabcabc";
str = str.replaceAll("[abc]+", "abc");
System.out.println("str = " + str);

结果:

str = abcddabceeabc

您可以使用

(\s*)(?:\s*\.\*\?){2,}

并替换为$1.*? 组1后向引用$1将在第一个.*?之前保留初始空白.*?

正则表达式匹配:

  • (\\s*) -第1组:零个或多个空格符号
  • (?:\\s*\\.\\*\\?){2,} -两个或更多序列:
    • \\s* -零个或多个空格符号
    • \\. -文字点
    • \\* -文字星号
    • \\? -文字? 符号

参见regex演示

样例代码:

String p = "(\\s*)(?:\\s*\\.\\*\\?){2,}"; 
String str = "<b.*?n.*? .*?a.*?n.*? .*?e.*? \\.*? .*? .*? .e.*?t.*?e.*?   .*?   .*? .*? .*?<.r>.*? .*?e.*? .*? .*? .*?l.*?e .*?b.*?e.*?n.*?b.*? .*?  .*?a.*?p.*?t.*? .*?l.*? .*? .*? .*? .*? ..b.*? .*? .*?s.*?   .*?s.*?   .*?>.*? .*?es.*? .*?n.*?t.*?r.*? .*? .*? .*? .n.*?b.*? .*? .*? .*? .*? .*?e.*? .*? .*? .*? .*?t.*?n.*? .*? .*? .*? .*?n.s.. .*?a. .*? <.*?e.e.*? comp.*? .*?<.*? .*?r.*?el.*?&.*?b.*? .*? .*?y.*? ..e.*? .. .*? .*? .*? .*? .*?u.t.*?m..o.*?b.*?r.*?e.*?n.*?o.. .*? .*?s. .*?e.*?o.. .*?r.*?r.*?&.*?b.*? ..b>.*?o.*?s.*? .*?r.*? .*? .*?a..i.*? .*? .*? .*?e.*?in.*? .*? .*? .*? .*? .*? .*? ..b.*? .*? .*? .*?r..i.*?c.*? .*? .*?o.*?<..>.*?"; 
String subst = "$1.*?"; 
System.out.println(str.replaceAll(p, subst));

IDEONE演示

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM