從第一列中提取子字符串

Question

我有2列的大型文本文件。 第一列既大又復雜，但其中包含name="..."部分。 第二列只是一個數字。

如何生成文本文件，使得第一列僅包含名稱，而第二列保持不變並顯示數字？ 基本上，我只想從第一列中提取一個子字符串，並使第二列保持不變。

樣本數據：

application{id="1821", name="app-name_01"} 0
application{id="1822", name="myapp-02", optionalFlag="false"} 1
application{id="1823", optionalFlag="false", name="app_name_public"} 3
...

所以結果文件將是這樣的

app-name_01     0
myapp-02        1
app_name_public 3
...

Answer 1

如果您的實際Input_file與所示示例相同，則以下代碼可能會幫助您。

awk '{sub(/.*name=\"/,"");sub(/\".* /," ")} 1'  Input_file

輸出如下。

app-name_01 0
myapp-02 1
app_name_public 3

Answer 2

使用GNU awk

$ awk 'match($0,/name="([^"]*)"/,a){print a[1],$NF}' infile
app-name_01 0
myapp-02 1
app_name_public 3

非高克

awk 'match($0,/name="([^"]*)"/){t=substr($0,RSTART,RLENGTH);gsub(/name=|"/,"",t);print t,$NF}' infile
app-name_01 0
myapp-02 1
app_name_public 3

輸入：

$ cat infile
application{id="1821", name="app-name_01"} 0
application{id="1822", name="myapp-02", optionalFlag="false"} 1
application{id="1823", optionalFlag="false", name="app_name_public"} 3
...

Answer 3

這是一個sed解決方案：

sed -r 's/.*name="([^"]+).* ([0-9]+)$/\1 \2/g' Input_file

說明：

有了這些寄生蟲，您的商店便可以分組。
第一組是name="之后的所有內容，直到第一個" 。 [^"]意思是“不是雙引號”。
第二組簡單地是“在行的末尾有一個或多個數字”。

從第一列中提取子字符串

問題描述

3 個解決方案

解決方案1
3 已采納 2017-10-11 13:33:50

解決方案2
0 2017-10-11 13:33:45

解決方案3
0 2017-10-11 13:39:51

從第一列中提取子字符串

問題描述

3 個解決方案

解決方案1 3 已采納 2017-10-11 13:33:50

解決方案2 0 2017-10-11 13:33:45

解決方案3 0 2017-10-11 13:39:51

解決方案1
3 已采納 2017-10-11 13:33:50

解決方案2
0 2017-10-11 13:33:45

解決方案3
0 2017-10-11 13:39:51