将文件 1 中的字符串与文件 2 中的字符串匹配

Question

my data examples are 
1.txt
MTQZ3CODT0SQKGE3QE6B | j t | j | t | 22312 | stimpy | EST | 8 | 20 | text | list | 0 | | 2002-08-22 13:07:05

2.txt
 MTQZ3CODT0SQKGE3QE6B | joe@example.com

desired output 
joe@example.com | j t | j | t | 22312 | stimpy | EST | 8 | 20 | text | list | 0 | | 2002-08-22 13:07:05

我想用 2.txt 中的第二列匹配和替换 1.txt 中的第一列，到目前为止我确实尝试过：

awk 'BEGIN { while((getline < "file2.txt") > 0) a[$1]=$3 } { $1 = a[$1] } 1' file1.txt

它运行良好，但运行 12 小时后，我只完成了 1GB 看起来很慢

INFO: file1.txt=7GB  file2.txt=4GB my memory 16GB

我不确定是什么导致了缓慢的事情，但我希望如果有另一种快速的方法，那么我使用的 awk 会有所帮助。
谢谢！！

注意：我的内存不足有没有其他方法可以做到这一点，那就是根本没有数组？ 同样在我的情况下，线条是随机的，不在同一条线上！

Answer 1

$ join <(sort 2.txt) <(sort 1.txt) | cut -d' ' -f3-
joe@example.com | j t | j | t | 22312 | stimpy | EST | 8 | 20 | text | list | 0 | | 2002-08-22 13:07:05

如果这不是您所需要的全部，那么编辑您的问题以提供更真实的代表性样本输入/输出，包括这不起作用的情况。

Answer 2

你可以使用这个awk ：

awk -F ' *\\| *' -v OFS=' | ' '
FNR == NR {
   map[$1]=$2
   next
}
$1 in map {
   $1 = map[$1]
} 1' 2.txt 1.txt

joe@example.com | j t | j | t | 22312 | stimpy | EST | 8 | 20 | text | list | 0 |  | 2002-08-22 13:07:05

将文件 1 中的字符串与文件 2 中的字符串匹配

问题描述

2 个解决方案

解决方案1
2 2020-10-02 21:57:35

解决方案2
1 已采纳 2020-10-02 19:12:34

将文件 1 中的字符串与文件 2 中的字符串匹配

问题描述

2 个解决方案

解决方案1 2 2020-10-02 21:57:35

解决方案2 1 已采纳 2020-10-02 19:12:34

解决方案1
2 2020-10-02 21:57:35

解决方案2
1 已采纳 2020-10-02 19:12:34