awk從每一行中提取多個組

Question

當模式在一行中多次匹配時，如何對所有匹配的組執行操作？

為了說明，我想搜索/Hello! (\\d+)/ /Hello! (\\d+)/並使用數字，例如，打印出來或將它們相加，以便輸入

abcHello! 200 300 Hello! Hello! 400z3
ads
Hello! 0

如果我決定將它們打印出來，我會期待它的輸出

200
400
0

Answer 1

這是一個簡單的語法，每個awk（nawk，mawk，gawk等）都可以使用它。

{
    while (match($0, /Hello! [0-9]+/)) {
        pattern = substr($0, RSTART, RLENGTH);
        sub(/Hello! /, "", pattern);
        print pattern;
        $0 = substr($0, RSTART + RLENGTH);
    }
}

Answer 2

這是gawk語法。 當沒有固定文本可以作為記錄分隔符並且不符合換行符時，它也適用於模式：

 {
     pattern = "([a-g]+|[h-z]+)"
     while (match($0, pattern, arr))
     {
         val = arr[1]
         print val
         sub(pattern, "")
     }
 }

Answer 3

GNU awk

awk 'BEGIN{ RS="Hello! ";}
{
    gsub(/[^0-9].*/,"",$1)
    if ($1 != ""){ 
        print $1 
    }
}' file

Answer 4

沒有gawk函數可以在一行中多次匹配相同的模式。 除非您確切知道該模式重復的次數。

有了這個，你必須在同一行的所有匹配上“手動”迭代。 對於您的示例輸入，它將是：

{
  from = 0
  pos = match( $0, /Hello! ([0-9]+)/, val )
  while( 0 < pos )
  {
    print val[1]
    from += pos + val[0, "length"]
    pos = match( substr( $0, from ), /Hello! ([0-9]+)/, val )
  }
}

如果模式匹配換行符，則必須修改輸入記錄分隔符 - RS

awk從每一行中提取多個組

問題描述

4 個解決方案

解決方案1
11 已采納 2009-07-13 09:54:29

解決方案2
2 2009-07-12 16:20:03

解決方案3
1 2009-07-12 15:31:22

解決方案4
0 2009-07-27 07:05:49

awk從每一行中提取多個組

問題描述

4 個解決方案

解決方案1 11 已采納 2009-07-13 09:54:29

解決方案2 2 2009-07-12 16:20:03

解決方案3 1 2009-07-12 15:31:22

解決方案4 0 2009-07-27 07:05:49

解決方案1
11 已采納 2009-07-13 09:54:29

解決方案2
2 2009-07-12 16:20:03

解決方案3
1 2009-07-12 15:31:22

解決方案4
0 2009-07-27 07:05:49