如何基于列为键合并两个文件

Question

如何合并两个基于列的文件作为键，如何从a.txt匹配$ 1列并基于$ 3列追加b.txt

a.txt
aa; 2.5; 0.001;
ab; 1.5; 0.003;
ac; 0.4; 0.002;

b.txt

20-Nov-2014; 1775.00; aa;
20-Nov-2014; 1775.00; aa;
20-Nov-2014; 1463.40; ab;
20-Nov-2014; 1463.40; ac;
20-Nov-2014; 1463.40; ab;

Desired output look like this 
20-Nov-2014; 1775.00; aa; aa; 2.5; 0.001;
20-Nov-2014; 1775.00; aa; aa; 2.5; 0.001;
20-Nov-2014; 1463.40; ab; ab; 1.5; 0.003;
20-Nov-2014; 1463.40; ac; ac; 0.4; 0.002;
20-Nov-2014; 1463.40; ab; ab; 1.5; 0.003;

Thanks

Answer 1

$ awk -F';' 'FNR==NR{a[$1]=$0;next;} {print $0" " a[substr($3,2)];}' a.txt b.txt
20-Nov-2014; 1775.00; aa; aa; 2.5; 0.001;
20-Nov-2014; 1775.00; aa; aa; 2.5; 0.001;
20-Nov-2014; 1463.40; ab; ab; 1.5; 0.003;
20-Nov-2014; 1463.40; ac; ac; 0.4; 0.002;
20-Nov-2014; 1463.40; ab; ab; 1.5; 0.003;

这个怎么运作

awk隐式循环遍历文件中的每一行。 每行均分为多个字段。

-F';'

这告诉awk使用分号作为字段分隔符。
FNR==NR{a[$1]=$0;next;}

NR是到目前为止已读取的行数，而FNR是到目前为止已从当前文件读取的行数。 因此，当FNR==NR ，我们仍在读取第一个文件a.txt 。 在这种情况下，此集合将刚读入的整行$0分配给键$1的第三个字段数组a 。
next告诉awk跳过下面的其余命令，并跳到下一行并重新开始。
print $0" " a[substr($3,2)]

如果到达此处，则意味着我们正在处理第二个文件b.txt 。 在这种情况下，请打印此文件的每一行，然后打印数组a的行， a与第三字段匹配。
在文件b.txt ，第三个字段以空格开头。 在数组a查找此字段时，该空间将通过substr函数删除。

Answer 2

awk -F\; 'NR==FNR{arr[" "$1]=$0;next} {print $0, arr[$3]}'  a b
20-Nov-2014; 1775.00; aa; aa; 2.5; 0.001;
20-Nov-2014; 1775.00; aa; aa; 2.5; 0.001;
20-Nov-2014; 1463.40; ab; ab; 1.5; 0.003;
20-Nov-2014; 1463.40; ac; ac; 0.4; 0.002;
20-Nov-2014; 1463.40; ab; ab; 1.5; 0.003;

Answer 3

$ awk -F'; ?' 'NR==FNR{a[$1]=$0;next} {print $0, a[$3]}' a.txt b.txt
20-Nov-2014; 1775.00; aa; aa; 2.5; 0.001;
20-Nov-2014; 1775.00; aa; aa; 2.5; 0.001;
20-Nov-2014; 1463.40; ab; ab; 1.5; 0.003;
20-Nov-2014; 1463.40; ac; ac; 0.4; 0.002;
20-Nov-2014; 1463.40; ab; ab; 1.5; 0.003;

如何基于列为键合并两个文件

问题描述

3 个解决方案

解决方案1
1 已采纳 2014-11-21 05:46:14

这个怎么运作

解决方案2
1 2014-11-21 05:52:13

解决方案3
0 2014-11-21 05:44:17

如何基于列为键合并两个文件

问题描述

3 个解决方案

解决方案1 1 已采纳 2014-11-21 05:46:14

这个怎么运作

解决方案2 1 2014-11-21 05:52:13

解决方案3 0 2014-11-21 05:44:17

解决方案1
1 已采纳 2014-11-21 05:46:14

解决方案2
1 2014-11-21 05:52:13

解决方案3
0 2014-11-21 05:44:17