AWK：如何使用列打印字段分隔符（字段分隔符也是一个正则表达式）

Question

我有一个看起来像的文件

我想产生一个像

3 5 t27 s60  
4 8 s30 s40
2 2 t80 t10
6 4 s80 t10

因此，我将字段分隔符指定为s或t，但我想将这些字符保留在输出中。

Answer 1

如果将FS设置为正则表达式，则无法获得确切的字段定界符。

我将在此用例中使用sed ：

sed 's/...$/ &/' file

s命令用空格和其本身&替换行...末尾$之前的最后3个字符。

如果由于定界符后的字符数不固定而使从末尾开始的字符计数不起作用，则可以使用以下sed命令：

sed -r 's/(s|t)([^st]+)$/ \1\2/' file

我正在使用(s|t)后跟1个或多个字符的s或t搜索，直到都不是s或t 。

Answer 2

快速awk单行代码：

awk '{gsub(/[st]/," &",$0)}1' input.txt

输出：

3 5  t27 s60  
4 8  s30 s40
2 2  t80 t10
6 4  s80 t10

在这里，我们在gsub命令中使用&的特殊含义：它代表machted表达式。 因此， gsub(/[st]/," &",$0)在每个“ s”或“ t”之前加一个空格

如果重复出现空白是一个问题：

awk '{gsub(/[st]/," &",$0);gsub(/[ ]+/," ",$0)}1' input.txt

这使：

3 5 t27 s60 
4 8 s30 s40
2 2 t80 t10
6 4 s80 t10

Answer 3

或者，如果前一个字符不是空格，则在perl的“ s”或“ t”之前添加一个空格：

perl -pe 's/(?<=\S)([st])/ $1/g' file

等效的awk是

awk '{print gensub(/([^[:blank:]])([st])/, "\\\1 \\\2", "g")}' file