使用awk从字符串中提取子字符串

Question

我有可以是以下两种格式之一的字符串：

dts12931212112 : some random message1 : abc, xyz
nodts : some random message2

我需要从这两个没有'dts'部分的字符串中提取子字符串，即它应该返回：

some random message1 : abc, xyz
some random message2

我需要在bash脚本中执行此操作。

您可以使用awk命令为我提供帮助吗，这两种类型的字符串都可以执行此操作？

Answer 1

通过awk的gsub函数。

$ awk '{gsub(/^[^:]*dts[^:]*:|:[^:]*dts[^:]*/, "")}1' file
 some random message1 : abc, xyz
 some random message2
$ awk '{gsub(/^[^:]*dts[^:]*:[[:blank:]]*|:[^:]*dts[^:]*/, "")}1' file
some random message1 : abc, xyz
some random message2

您也可以在sed中应用相同的正则表达式，但是您需要启用-r --regexp-extended参数。

^断言我们是开始。 [^:]*否定的字符类，与任何字符匹配，但不匹配: ，零次或多次。 因此，此^[^:]*dts[^:]*:将与开头包含dts的子字符串匹配。 如果子字符串位于中间，则不会碰。 这个:[^:]*dts[^:]*模式匹配具有dts的中间或最后一个子字符串。 最后，将匹配的字符替换为空字符串将为您提供所需的输出。

更新：

$ awk '{gsub(/^[^[:space:]]*dts[^[:space:]]*[[:space:]:]*|[[:space:]:]*[^[:space:]]*dts[^[:space:]]*/, "")}1' file
some random message1 : abc, xyz
some random message2

Answer 2

这是另一个awk

awk -F" : " '{$1="";sub(FS,"")}1' OFS=" : " file
some random message1 : abc, xyz
some random message2

只需将第一个字段分开即可:

另一个版本：

awk -F" : " '{print substr($0,index($0,$2))}' file
some random message1 : abc, xyz
some random message2

从第二个字段获取所有数据，并以分隔:

使用awk从字符串中提取子字符串

问题描述

2 个解决方案

解决方案1
1 已采纳 2015-03-09 04:58:23

解决方案2
1 2015-03-09 06:26:31

使用awk从字符串中提取子字符串

问题描述

2 个解决方案

解决方案1 1 已采纳 2015-03-09 04:58:23

解决方案2 1 2015-03-09 06:26:31

解决方案1
1 已采纳 2015-03-09 04:58:23

解决方案2
1 2015-03-09 06:26:31