基於正則表達式的分割模式

Question

我正在嘗試編寫一個程序來解析Java垃圾收集日志。 我剛剛創建了與次要集合匹配的語法。 確定了模式后，我想將其解析為單獨的標記。 我的問題是，用我之前定義的語法有什么優雅的方法嗎？

public class RegexTestHarness {
  private final static String REGEX_SMALL_COLLECTION = "\\d+\\.\\d+: \\[GC \\d+.\\d+: \\[ParNew: \\d+K\\-\\>0K\\(\\d+K\\), \\d+.\\d+ secs\\] \\d+K\\-\\>\\d+K\\(\\d+K\\), \\d+.\\d+ secs\\]";

  public static void main(String[] args){
    Pattern pattern = Pattern.compile(REGEX_SMALL_COLLECTION);           
    Matcher matcher = pattern.matcher("54.770: [GC 54.770: [ParNew: 5232768K->0K(5237824K), 1.1304192 secs] 5238622K->380448K(10480704K), 1.1306410 secs]");
    while (matcher.find()) {            
      System.out.println(matcher.group(0));
      System.out.println(matcher.start());
      System.out.println(matcher.end()); 
    }
  }
}

Answer 1

您需要將組添加到正則表達式。

private final static String REGEX_SMALL_COLLECTION = "(\\\\d+\\\\.\\\\d+): \\\\[GC (\\\\d+.\\\\d+): \\\\[ParNew: \\\\d+K\\\\-\\\\>0K\\\\(\\\\d+K\\\\), \\\\d+.\\\\d+ secs\\\\] \\\\d+K\\\\-\\\\>\\\\d+K\\\\(\\\\d+K\\\\), \\\\d+.\\\\d+ secs\\\\]";

然后訪問組中的值。 在上面的示例中，我在想要的前兩個項目周圍添加了括號-告訴正則表達式引擎捕獲匹配的子字符串。 您將需要添加更多。 當前，您使用Matcher.group()獲取每個組。 請注意，組0始終是整個匹配項。 其余的從1開始按編號順序排列( 。

基於正則表達式的分割模式

問題描述

1 個解決方案

解決方案1
1 已采納 2012-07-26 13:33:12

基於正則表達式的分割模式

問題描述

1 個解決方案

解決方案1 1 已采納 2012-07-26 13:33:12

解決方案1
1 已采納 2012-07-26 13:33:12