使用awk解析制表符分隔的文件，該文件中的字段中包含逗號

Question

我想使用awk刪除以下輸入文件的第二個字段中“：”之后的所有值。

輸入項

text1   [a:2,b:1,c:4,k:0]
text2   [d:1,a:5,f:3.2]

輸出量

text1   a,b,c,k
text2   d,a,f

我能夠使用R做到這一點，但是在較大的文件上有點慢。

Answer 1

使用sed （假設您也想刪除括號）：

$ sed 's/\[\|:[^,]*//g' file
text1   a,b,c,k
text2   d,a,f

使用awk ：

$ awk '{gsub(/\[|:[^,]*/,"")}1' file
text1   a,b,c,k
text2   d,a,f

Answer 2

另一種方法：

awk '{
  printf "%s ", $1
  n = split($2, a, /[][,:]/)
  sep=""
  for (i=2; i<n; i+=2) {
    printf "%s%s", sep, a[i]
    sep=","
  }
  print ""
}' <<END
text1   [a:2,b:1,c:4,k:0]
text2   [d:1,a:5,f:3.2]
END

text1 a,b,c,k
text2 d,a,f

使用awk解析制表符分隔的文件，該文件中的字段中包含逗號

問題描述

2 個解決方案

解決方案1
7 2014-05-16 19:34:25

解決方案2
1 2014-05-16 21:36:15

使用awk解析制表符分隔的文件，該文件中的字段中包含逗號

問題描述

2 個解決方案

解決方案1 7 2014-05-16 19:34:25

解決方案2 1 2014-05-16 21:36:15

解決方案1
7 2014-05-16 19:34:25

解決方案2
1 2014-05-16 21:36:15