繁体   English   中英

如何使用awk(或剪切)从管道分隔的文件中每行打印最后一个字段?

[英]How can I use awk (or cut) to print the last field per line from a pipe separated file?

我有一个这样的文件

14618   | 184.72.251.121   | 184.72.128.0/17     | US | arin     | 2010-01-26 | AMAZON-AES - Amazon.com, Inc., US
14618   | 107.21.223.240   | 107.21.128.0/17     | US | arin     | 2011-05-03 | AMAZON-AES - Amazon.com, Inc., US
16509   | 52.85.180.156    | 52.85.180.0/23      | US | arin     |            | AMAZON-02 - Amazon.com, Inc., US
61337   | 85.199.214.99    | 85.199.212.0/22     | GB | ripencc  | 2005-02-08 | ECOM-AS ============================================, GB
31034   | 94.177.187.22    | 94.177.160.0/19     | IT | ripencc  | 2008-08-14 | ARUBA-ASN, IT
8816    | 212.45.144.206   | 212.45.128.0/19     | IT | ripencc  |            | IT-STCOM, IT

我必须提取最后一个字段及其所有内容。 请注意,有时倒数第二列为空。

我试过了

awk 'BEGIN { ORS = " "}; {for(i=13;i<NF;++i) print $i}'

但有时它不起作用或遗漏了一些单词。

你能帮我吗?

尝试这个 -

 awk -F'|' '{print $NF}' file
 AMAZON-AES - Amazon.com, Inc., US
 AMAZON-AES - Amazon.com, Inc., US
 AMAZON-02 - Amazon.com, Inc., US
 ECOM-AS ============================================, GB
 ARUBA-ASN, IT
 IT-STCOM, IT

如果这不是您期望的输出,请发布您的期望输出。

使用sed:替换最长的匹配项| 一无所有。

$ sed 's/.*|//' infile
 AMAZON-AES - Amazon.com, Inc., US
 AMAZON-AES - Amazon.com, Inc., US
 AMAZON-02 - Amazon.com, Inc., US
 ECOM-AS ============================================, GB
 ARUBA-ASN, IT
 IT-STCOM, IT

如果您不希望前导空格,也将其删除:

$ sed 's/.*|[[:blank:]]*//' infile
AMAZON-AES - Amazon.com, Inc., US
AMAZON-AES - Amazon.com, Inc., US
AMAZON-02 - Amazon.com, Inc., US
ECOM-AS ============================================, GB
ARUBA-ASN, IT
IT-STCOM, IT

这匹配到最后一个| 并在|之后包含尽可能多的空格| ,然后删除匹配项。

还原每一行,以剪切方式读取第一列,然后还原:

rev input | cut -f1 -d\| | rev

看起来您最好将awk| 字符作为字段分隔符( awk -F'|' ),但是,如果始终像这样将它们很好地对齐,则cut可能是一个更好的选择:

cut -c81- inputFile

这样一来,您就可以在每行中找到从位置81开始的所有字符,而从我眼中的数据来看,这大概是正确的。 试错的位将给出一个更准确的值来代替使用81 ,因为我可以用一对夫妇离开-我的眼球都不像年轻时那样他们曾经是:-)

看来您只想要第七| 输入的定界字段:

cut -d\| -f7
 AMAZON-AES - Amazon.com, Inc., US
 AMAZON-AES - Amazon.com, Inc., US
 AMAZON-02 - Amazon.com, Inc., US
 ECOM-AS ============================================, GB
 ARUBA-ASN, IT
 IT-STCOM, IT

如果您想摆脱前导空间,也可以用cut删除它:

cut -d\| -f7- | cut -c2-

我假设在最后一个字段中,您指的是最后一列。 这是您需要的:

awk -F'\|' '{print $7}' MyFile

在这种情况下,它将打印文件的最后一列。

您可以使用grep

$ grep -o '[^|]*$' file
 AMAZON-AES - Amazon.com, Inc., US
 AMAZON-AES - Amazon.com, Inc., US
 AMAZON-02 - Amazon.com, Inc., US
 ECOM-AS ============================================, GB
 ARUBA-ASN, IT
 IT-STCOM, IT

如果您不想要前导空格:

grep -o '[^|]*$' file | cut -d' ' -f2-
AMAZON-AES - Amazon.com, Inc., US
AMAZON-AES - Amazon.com, Inc., US
AMAZON-02 - Amazon.com, Inc., US
ECOM-AS ============================================, GB
ARUBA-ASN, IT
IT-STCOM, IT

您还可以使用Bash参数扩展:

$ while read -r line; do echo ${line##*|}; done <file
AMAZON-AES - Amazon.com, Inc., US
AMAZON-AES - Amazon.com, Inc., US
AMAZON-02 - Amazon.com, Inc., US
ECOM-AS ============================================, GB
ARUBA-ASN, IT
IT-STCOM, IT

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM