[英]Awk: how to print the field separator with your columns (field separator also a regular expression)
我有一个看起来像的文件
3 5 t27s60
4 8 s30s40
2 2 t80t10
6 4 s80t10
我想产生一个像
3 5 t27 s60
4 8 s30 s40
2 2 t80 t10
6 4 s80 t10
因此,我将字段分隔符指定为s或t,但我想将这些字符保留在输出中。
如果将FS
设置为正则表达式,则无法获得确切的字段定界符。
我将在此用例中使用sed
:
sed 's/...$/ &/' file
s
命令用空格和其本身&
替换行...
末尾$
之前的最后3个字符。
如果由于定界符后的字符数不固定而使从末尾开始的字符计数不起作用,则可以使用以下sed
命令:
sed -r 's/(s|t)([^st]+)$/ \1\2/' file
我正在使用(s|t)
后跟1个或多个字符的s
或t
搜索,直到都不是s
或t
。
快速awk单行代码:
awk '{gsub(/[st]/," &",$0)}1' input.txt
输出:
3 5 t27 s60
4 8 s30 s40
2 2 t80 t10
6 4 s80 t10
在这里,我们在gsub
命令中使用&
的特殊含义:它代表machted表达式。 因此, gsub(/[st]/," &",$0)
在每个“ s”或“ t”之前加一个空格
如果重复出现空白是一个问题:
awk '{gsub(/[st]/," &",$0);gsub(/[ ]+/," ",$0)}1' input.txt
这使:
3 5 t27 s60
4 8 s30 s40
2 2 t80 t10
6 4 s80 t10
或者,如果前一个字符不是空格,则在perl的“ s”或“ t”之前添加一个空格:
perl -pe 's/(?<=\S)([st])/ $1/g' file
等效的awk是
awk '{print gensub(/([^[:blank:]])([st])/, "\\\1 \\\2", "g")}' file
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.