在AWK中使用Bash數組

Question

我有兩個文件，如下所示：

file1 ：

3 1
2 4
2 1

file2 ：

file1的第二個字段用於指定file2的行，其中包含要檢索和打印的數字。 在所需的輸出中，將打印file1 1的第一個字段，然后打印檢索到的字段。

所需的輸出文件：

3 23
2 45
2 23

這是我嘗試解決此問題的嘗試：

IFS=$'\r\n' baf2=($(cat file2));echo;awk -v av="${baf2[*]}"  'BEGIN {split(av, aaf2, / /)}{print $1, aaf2[$2]}' file1;echo;echo ${baf2[*]}

但是，此腳本不能使用Bash數組baf2 。

該解決方案必須高效，因為在實際情況下file1有數十億行， file2有數百萬行。

Answer 1

你可以使用這個awk

awk 'FNR==NR {a[NR]=$1;next} {print $1,a[$2]}' file2 file1
3 23
2 45
2 23

對數組a中的file2進行排序。
然后從文件1打印字段1 ，並使用字段2在數組中查找。

Answer 2

這與Jotne的解決方案具有相似的基礎，但是首先將file2加載到內存中（因為它小於file1）：

awk 'FNR==NR{x[FNR]=$0;next}{print $1 FS x[$2]}' file2 file1

說明

FNR == NR部分意味着僅在讀取file2而不是file1時才執行大括號后面的部分。 讀取file2的每一行時，它將被保存在數組x []中，並由當前行號索引。 對文件1的每一行執行第二組花括號中的部分，並在該行上打印第一個字段，然后打印字段分隔符（空格），然后在x []中輸入該行的第二個字段索引的條目。

Answer 3

使用awk

1）打印file1中的所有行，無論是否匹配

awk 'NR==FNR{a[NR]=$1;next}{print $1,a[$2]}' file2 file1

2）僅打印匹配行

awk 'NR==FNR{a[NR]=$1;next}$2=a[$2]' file2 file1

在AWK中使用Bash數組

問題描述

3 個解決方案

解決方案1
1 2014-02-19 08:10:39

解決方案2
1 2014-02-19 09:19:51

解決方案3
1 2014-02-19 09:34:05

在AWK中使用Bash數組

問題描述

3 個解決方案

解決方案1 1 2014-02-19 08:10:39

解決方案2 1 2014-02-19 09:19:51

解決方案3 1 2014-02-19 09:34:05

解決方案1
1 2014-02-19 08:10:39

解決方案2
1 2014-02-19 09:19:51

解決方案3
1 2014-02-19 09:34:05