如何grep和从文件中删除分隔符之间的所有行

Question

我有一个看起来像这样的文件：

===SEPARATOR===
line2
line3
===SEPARATOR===
line5
line6
===SEPARATOR===
line8
...
lineX
===SEPARATOR===

我该如何进行while循环并遍历文件，将两个===SEPARATOR===事件之间的所有内容转储到另一个文件中以进行进一步处理？ 我只想将line2，line3添加到第一次迭代的第二个文件中。 我将解析该文件； 在下一次迭代中，我希望第二个文件中的line5 line6再次执行相同的解析，但是对不同的数据进行解析。

Answer 1

您可以使用grep -v排除所有匹配===SEPARATOR===行，并将其余的行重定向到文件：

grep -vx '===SEPARATOR===' file > file_processed

-x确保仅排除完全匹配===SEPARATOR===的行。

Answer 2

它使用sed查找分隔符之间的行，然后使用grep -v删除分隔符。

$ sed -n '/===SEPARATOR===/,/===SEPARATOR===/ p' file | grep -v '===SEPARATOR==='
line2
line3
line8
...
lineX

必须有一个更优雅的答案，该答案不会重复分隔符3次，但我正在绘制空白。

Answer 3

我假设您不需要line5和line6。 您可以使用awk做到这一点：

awk '$0 == "===SEPARATOR===" {interested = ! interested; next} interested {print}'

鸣谢到https://www.gnu.org/software/gawk/manual/html_node/Boolean-Ops.html#Boolean-Ops

输出：

[root@hostname ~]# cat /tmp/1 | awk '$0 == "===SEPARATOR===" {interested = ! interested; next} interested {print}' /tmp/1
line2
line3
line8
...
lineX

Answer 4

awk解救！

具有多字符支持（例如gawk）

$ awk -v RS='\n?===SEPARATOR===\n' '!(NR%2)' file

line2
line3
line8
...
lineX

或没有

$ awk '/===SEPARATOR===/{p=!p;next} p' file

line2
line3
line8
...
lineX

这与@Jay Rajput的答案几乎相同。

Answer 5

听起来您想将每一行行保存到单独的文件中 。

以下解决方案创建输出文件f1 ， f2 ，其中包含===SEPARATOR===行之间的（非空）行块。

使用GNU Awk或Mawk：

awk -v fnamePrefix='f' -v RS='(^|\n)===SEPARATOR===(\n|$)' \
  'NF { fname = fnamePrefix (++n); print > fname; close(fname) }' file

纯bash会很慢：

#!/usr/bin/env bash

fnamePrefix='f'; i=0
while IFS= read -r line; do
  [[ $line == '===SEPARATOR===' ]] && { (( ++i )); > "${fnamePrefix}${i}"; continue; }
  printf '%s\n' "$line" >> "${fnamePrefix}${i}"
done < file

如何grep和从文件中删除分隔符之间的所有行

问题描述

5 个解决方案

解决方案1
1 2016-11-03 22:28:56

解决方案2
1 2016-11-03 22:38:30

解决方案3
1 2016-11-03 23:05:00

解决方案4
1 2016-11-03 23:48:35

解决方案5
1 已采纳 2016-11-04 00:34:32

如何grep和从文件中删除分隔符之间的所有行

问题描述

5 个解决方案

解决方案1 1 2016-11-03 22:28:56

解决方案2 1 2016-11-03 22:38:30

解决方案3 1 2016-11-03 23:05:00

解决方案4 1 2016-11-03 23:48:35

解决方案5 1 已采纳 2016-11-04 00:34:32

解决方案1
1 2016-11-03 22:28:56

解决方案2
1 2016-11-03 22:38:30

解决方案3
1 2016-11-03 23:05:00

解决方案4
1 2016-11-03 23:48:35

解决方案5
1 已采纳 2016-11-04 00:34:32