Sed正則表達式和子串否定

Question

查找與特定模式不匹配的子字符串（前面跟着特定字符串的字符串）的正確語法是什么？

例如，我想取所有以BEGIN_ 開頭的子串，以_END 結尾， BEGIN_的子串不等於FOO ; 並用格式“（ inner substring ）”替換整個子字符串 。 以下內容將匹配：

BEGIN_bar_END - > (bar)
BEGIN_buz_END - > (buz)
BEGIN_ihfd8f398IHFf9f39_END - > (ihfd8f398IHFf9f39)

但是BEGIN_FOO_END不匹配。

我玩過以下內容，但似乎無法找到正確的語法：

sed -e 's/BEGIN_(^FOO)_END/($1)/g'
sed -e 's/BEGIN_([^FOO])_END/($1)/g'
sed -e 's/BEGIN_(?!FOO)_END/($1)/g'
sed -e 's/BEGIN_(!FOO)_END/($1)/g'
sed -e 's/BEGIN_(FOO)!_END/($1)/g'
sed -e 's/BEGIN_!(FOO)_END/($1)/g'

Answer 1

在sed ，IIRC中沒有一般否定運算符，因為對DFA的否定的正則表達式的編譯需要指數時間。 你可以解決這個問題

'/BEGIN_FOO_END/b; s/BEGIN_\(.*\)_END/(\1)/g'

where /BEGIN_FOO_END/b表示：如果我們找到BEGIN_FOO_END ，則跳轉（跳轉）到sed腳本的末尾。

Answer 2

這個話題可能很舊，但為了完整起見，否定運算符! ：

讓所有不快樂成為非常快樂：

echo -e 'happy\nhappy\nunhappy\nhappy' | sed '/^happy/! s/.*/VERY HAPPY/'

在這里找到：如何全局替換不以特定模式開頭的行中的字符串

Answer 3

這可能對你有用：

sed 'h;s/BEGIN_\(.*\)_END/(\1)/;/^(FOO)$/g' file

這僅在每行只有一個字符串時有效。

對於每行多個字符串：

sed 's/BEGIN_\([^F][^_]*\|F[^O][^_]*\|FO[^O][^_]*\|FOO[^_]\+\)_END/\(\1\)/g' file

或者更容易理解：

sed 's/\(BEGIN_\)FOO\(_END\)/\1\n\2/g;s/BEGIN_\([^\n_]*\)_END/(\1\)/g;s/\n/FOO/g' file

Answer 4

我不知道一個漂亮的方式，但你總能做到這一點：

$ cat file
BEGIN_FOO_END
BEGIN_FrOO_END
BEGIN_rFOO_END
$ sed '/BEGIN_FOO_END/ !{s/BEGIN_\([^_]*\)_END/(\1)/}' file 
BEGIN_FOO_END
(FrOO)
(rFOO)

Sed正則表達式和子串否定

問題描述

4 個解決方案

解決方案1
36 已采納 2012-01-29 12:29:05

解決方案2
16 2016-01-27 19:04:22

解決方案3
4 2012-01-29 15:43:43

解決方案4
2 2012-01-29 12:32:04

Sed正則表達式和子串否定

問題描述

4 個解決方案

解決方案1 36 已采納 2012-01-29 12:29:05

解決方案2 16 2016-01-27 19:04:22

解決方案3 4 2012-01-29 15:43:43

解決方案4 2 2012-01-29 12:32:04

解決方案1
36 已采納 2012-01-29 12:29:05

解決方案2
16 2016-01-27 19:04:22

解決方案3
4 2012-01-29 15:43:43

解決方案4
2 2012-01-29 12:32:04