grep/awk：有條件地排除單詞

Question

我的數據格式如下：

a cat
a dog
brown cat
brown dog
brown cow
brown sheep
brown fish

我想過濾掉所有以“brown”開頭的行，除了brown dog 。 有沒有一種簡單的方法可以使用 grep 或 awk 做到這一點？ 我嘗試像這樣使用克拉否定：

grep -v "brown ^\(dog\)" corpus.txt

......但這沒有用。 任何想法將不勝感激。

最終我希望 output 是這樣的：

a cat
a dog
brown dog

Answer 1

使用awk ：

awk '/^brown dog/ || !/^brown/' file

a cat
a dog
brown dog

就像這里的學術練習一樣，是沒有實驗性PCRE選項的grep命令：

grep -vE '^brown($|[^ ]| ([^d]|$)| d([^o]|$)| do([^g]|$))' file

Answer 2

是的先生：

grep -vP '^brown (?!dog)' file

a cat
a dog
brown dog

-P用於pcre引擎。
檢查說明

Answer 3

awk '/^brown/ && !/dog$/{next} 1' file

Answer 4

~~好的，這里已經過了午夜。~~ ~~我要發布這個 awk：~~

 $ awk '!(/brown/ && !/dog/)' file

~~...並在早上想通了。~~ ~~:D 晚安。~~

不，睡不着，必須解決它：

$ awk '!/^brown/ || /dog/' file

Output：

a cat
a dog
brown dog

Answer 5

目前尚不清楚您是否只想接受“棕色狗”，但也許您只想要類似的東西：

sed -e '/^brown/{/dog/!d;}'

這將刪除所有以“brown”開頭的行，除非它們與字符串“dog”匹配。 或者，也許您想更嚴格並執行以下操作：

awk '!/^brown/ || $2 == "dog"'

Answer 6

另一個awk ：

$ awk '!(/^brown/ && $2!="dog")' file
a cat
a dog
brown dog