提取两个模式之间的所有行，至少包含一个字符串的出现

Question

我有一个大文件存储在 bash 变量中作为字符串，我需要提取两个相同单词之间的所有行。 但我还需要检查这些行之间是否至少出现了一次magicstring 。 这是一个例子：

abc
xxxxxxxx
yyyyyyyy

abc
magicstring
kkkkkkkk
magicstring

abc
mmmmmmmm
nnnnnnnn

我正在寻找的是以下内容：

magicstring
kkkkkkkk
magicstring

两个相同的词总是abc ，但是使用 sed、awk 甚至参数扩展，我怎么能精确地知道我需要在这些行中至少包含一次的单词magicstring ？

我假设我不知道包含magicstring的部分，因为它是一个大文件。 编辑：此外， magicstring仅在一个部分中仅出现一次或多次。

例如，使用 sed ，我会得到这样的所有行： sed '/abc/,/abc/{//!d}' <<<($myFileInVar)但我不知道要精确地需要magicstring 。

Answer 1

gawk的救援！

$ awk -v RS='(^|\n)abc\n' '/magicstring/' file

magicstring
kkkkkkkk
magicstring

将分隔符定义为记录分隔符，如果它与魔术字符串匹配则打印记录。

Answer 2

在每个 UNIX 框上的任何 shell 中使用任何 awk：

$ awk -v RS= -v ORS='\n\n' '/magicstring/' file
abc
magicstring
kkkkkkkk
magicstring

$ awk -v RS= -v ORS='\n\n' '/magicstring/{sub(/^[^\n]+\n/,""); print}' file
magicstring
kkkkkkkk
magicstring

提取两个模式之间的所有行，至少包含一个字符串的出现

问题描述

2 个解决方案

解决方案1
1 2020-04-22 23:09:21

解决方案2
1 2020-04-22 23:25:48

提取两个模式之间的所有行，至少包含一个字符串的出现

问题描述

2 个解决方案

解决方案1 1 2020-04-22 23:09:21

解决方案2 1 2020-04-22 23:25:48

解决方案1
1 2020-04-22 23:09:21

解决方案2
1 2020-04-22 23:25:48