在awk中将字段拆分为数组，然后在另一个文件中搜索每个术语

Question

我正在尝试将特定文件中的字段分解为数组，然后检查每个术语是否出现在第二个文件中（该文件已经存储在另一个数组中）。 目标是合并两个文件中的信息。

第一个file1 （具有要拆分的字段的文件）如下所示：

data1=data2=data3 some more stuff
data4=data1 this are things
data2=data5 more text here
...

虽然file2具有以下结构：

data1 10
data2 20
data3 35
data4 15
data5 60

我想使用=拆分file1的第一个字段，然后在第二个文件中搜索每个拆分的术语，并以以下格式打印所有内容：

output ：

data1=data2=data3 some more stuff 10
data1=data2=data3 some more stuff 20
data1=data2=data3 some more stuff 35
data4=data1 this are things 15
data4=data1 this are things 10
data2=data5 more text here 20
data2=data5 more text here 60

到目前为止，我已经知道了：

awk 'NR==FNR {
l[$1] = $2; next
} {
la=split($1,a,"=")
for(x=1;x<=la;x++)
  print $0,l[a[$x]]
}' file2 file1 > output

首先（当NR==FNR ），我使用第一个字段作为键将file2数据存储在数组l 。

然后，我以以下方式解析下一个文件：对于每个记录，我将= $1用作分隔符，将字段$1拆分为数组la 。 la变量将项数存储在数组a 。

对于数组a （ for循环）中的每个元素，我在数组l寻找相应的键并输出当前的内容+ l值。

但是，由于某种原因，我只能从file1获取内容（当前的不需要的输出）：

data1=data2=data3 some more stuff 
data1=data2=data3 some more stuff 
data1=data2=data3 some more stuff 
data4=data1 this are things 
data4=data1 this are things 
data2=data5 more text here 
data2=data5 more text here

关于我的代码可能有什么问题的任何想法？

非常感谢！

Answer 1

awk解救！

如果令牌是固定长度的，则可以进行模式匹配而无需拆分字段

$ awk 'NR==FNR{a[$1]=$2;next}
              {for(k in a) if($1~k) print $0, a[k]}' file2 file1

data1=data2=data3 some more stuff 10
data1=data2=data3 some more stuff 20
data1=data2=data3 some more stuff 35
data4=data1 this are things 10
data4=data1 this are things 15
data2=data5 more text here 20
data2=data5 more text here 60

Answer 2

我自己找到了答案。 这是变量命名的问题。

这是正确的代码：

awk 'NR==FNR {
l[$1] = $2; next
} {
la=split($1,a,"=")
for(x=1;x<=la;x++)
  print $0,l[a[x]]
}' file2 file1 > output

该键位于打印功能中。 现在print $0,l[a[x]]它读取print $0,l[a[x]]而不是print $0,l[a[$x]] 。 循环使用x作为其内部计数器，而不是$x 。 现在将其更改指向数组l的正确键（来自file2 ）。

我要离开该职位，因为看起来以前没有提出过这个问题。 请告诉我您是否认为这没有用。

谢谢！

在awk中将字段拆分为数组，然后在另一个文件中搜索每个术语

问题描述

2 个解决方案

解决方案1
1 2016-01-01 06:21:51

解决方案2
0 已采纳 2015-12-29 11:59:26

在awk中将字段拆分为数组，然后在另一个文件中搜索每个术语

问题描述

2 个解决方案

解决方案1 1 2016-01-01 06:21:51

解决方案2 0 已采纳 2015-12-29 11:59:26

解决方案1
1 2016-01-01 06:21:51

解决方案2
0 已采纳 2015-12-29 11:59:26