使用awk修改文本

Question

我正在嘗試使用awk修改文本文件。 有三列，我想刪除第一列中的部分文本：

range=chr1      20802865        20802871        
range=chr1      23866528        23866534

至

chr1      20802865        20802871        
chr1      23866528        23866534

我怎樣才能做到這一點？

我試過awk '{ substr("range=chr*", 7) }'和awk '{sub(/[^[:space:]]*\\\\/, "")}1'但它刪除了所有文件的內容。

Answer 1

將字段分隔符設置為=並打印第二個字段：

# With awk                                                                     
$ awk -F= '{print $2}' file
chr1      20802865        20802871        
chr1      23866528        23866534

# Or with cut
$ cut -d= -f2 file                  
chr1      20802865        20802871        
chr1      23866528        23866534

# How about grep
$ grep -Po '(?<==).*' file
chr1      20802865        20802871        
chr1      23866528        23866534

# Temp file needed
$ cut -d= -f2 file > tmp; mv tmp file

如果要將更改存儲回file ， awk ， cut和grep都需要臨時file ，更好的解決方案是使用sed ：

 sed -i 's/range=//' file

這替換了range=什么都沒有， -i意味着更改是就地完成的，所以不需要處理臨時文件的東西，就像sed為你做的那樣。

Answer 2

看起來您在文件中使用制表符而不是空格作為分隔符，因此：

awk 'BEGIN{FS="[=\t]"; OFS="\t"} {print $2, $3, $4}' input_file

要么

awk 'BEGIN{FS="[=\t]"; OFS="\t"} {$1=""; gsub("\t\t", "\t"); print}' input_file

Answer 3

如果你不需要使用awk ，你可以使用sed ，我覺得它有點簡單。 希望你熟悉正則表達式運算符，比如^和. 。

$ cat awkens
range=chr1      20802865        20802871
range=chr1      23866528        23866534
$ sed 's/^range=//' awkens
chr1      20802865        20802871
chr1      23866528        23866534

使用awk修改文本

問題描述

3 個解決方案

解決方案1
6 已采納 2012-12-05 15:48:01

解決方案2
1 2012-12-05 15:47:49

解決方案3
1 2012-12-05 15:51:52

使用awk修改文本

問題描述

3 個解決方案

解決方案1 6 已采納 2012-12-05 15:48:01

解決方案2 1 2012-12-05 15:47:49

解決方案3 1 2012-12-05 15:51:52

解決方案1
6 已采納 2012-12-05 15:48:01

解決方案2
1 2012-12-05 15:47:49

解決方案3
1 2012-12-05 15:51:52