引號之間的Grep模式

Question

我正在嘗試grep代碼庫以找到引號之間的字母數字代碼。 因此，例如我的代碼庫可能包含以下行

some stuff "A234DG3" maybe more stuff

我想輸出：A234DG3

我很幸運，因為我知道我的字符串是7個長且只有整數和字母AZ，az。

玩了一段時間之后，我想出了以下幾點，但並沒有得出我想要的結果

grep -ro '".*"' . | grep [A-Za-z0-9]{7} | less

我在哪里錯了？ 感覺grep應該給我我想要的東西，但是我最好還是使用其他東西嗎？ 干杯!

Answer 1

使用基本或擴展的POSIX正則表達式無法用grep提取引號之間的值。 從那以后，我將使用sed作為便攜式解決方案：

sed -n 's/.*\"\([^"]\+\)".*/\1/p' <<< 'some stuff "A234DG3" maybe more stuff'

但是，有了GNU好東西，GNU grep將使用-P命令行選項支持PCRE表達式。 您可以使用此：

grep -oP '.*?"\K[^"]+(?=")' <<< 'some stuff "A234DG3" maybe more stuff'

.*"匹配所有內容，直到包含第一個引號為止。 \\K選項清除匹配的緩沖區，因此像方便，動態的lookbehind斷言一樣工作。（我本可以使用真正的 lookbehind，但是我喜歡\\K ）。 [^"]+匹配引號之間的文本。 (?=")是一個先行斷言，確保比賽之后的保證將遵循" --而不包括在比賽中。

Answer 2

問題在於，非常需要RE才能匹配最長的序列。 因此，給定類似：

a "bcd" efg "hij" klm "nop" q

模式".*"應該匹配： "bcd" efg "hij" klm "nop" （從第一個引用到最后一個引用的所有內容），而不僅僅是"bcd" 。

您可能想要一個更像"[^"]*"來匹配開引號，任意數量的其他東西，然后匹配一個右引號。

Answer 3

因此，經過更多的討論之后，我想出了這個，它可以為我提供以下幫助：

grep -r -E -o '"[A-Za-z0-9]{7}"' . | less

使用-E允許使用{7}長度匹配器

引號之間的Grep模式

問題描述

3 個解決方案

解決方案1
0 2015-04-22 20:45:14

解決方案2
0 2015-04-22 20:47:05

解決方案3
0 已采納 2015-04-23 07:42:46

引號之間的Grep模式

問題描述

3 個解決方案

解決方案1 0 2015-04-22 20:45:14

解決方案2 0 2015-04-22 20:47:05

解決方案3 0 已采納 2015-04-23 07:42:46

解決方案1
0 2015-04-22 20:45:14

解決方案2
0 2015-04-22 20:47:05

解決方案3
0 已采納 2015-04-23 07:42:46