[英]split field into array in awk, then search each term in another file
我正在尝试将特定文件中的字段分解为数组,然后检查每个术语是否出现在第二个文件中(该文件已经存储在另一个数组中)。 目标是合并两个文件中的信息。
第一个file1
(具有要拆分的字段的文件)如下所示:
data1=data2=data3 some more stuff
data4=data1 this are things
data2=data5 more text here
...
虽然file2
具有以下结构:
data1 10
data2 20
data3 35
data4 15
data5 60
我想使用=
拆分file1
的第一个字段,然后在第二个文件中搜索每个拆分的术语,并以以下格式打印所有内容:
output
:
data1=data2=data3 some more stuff 10
data1=data2=data3 some more stuff 20
data1=data2=data3 some more stuff 35
data4=data1 this are things 15
data4=data1 this are things 10
data2=data5 more text here 20
data2=data5 more text here 60
到目前为止,我已经知道了:
awk 'NR==FNR {
l[$1] = $2; next
} {
la=split($1,a,"=")
for(x=1;x<=la;x++)
print $0,l[a[$x]]
}' file2 file1 > output
首先(当NR==FNR
),我使用第一个字段作为键将file2
数据存储在数组l
。
然后,我以以下方式解析下一个文件:对于每个记录,我将=
$1
用作分隔符,将字段$1
拆分为数组la
。 la
变量将项数存储在数组a
。
对于数组a
( for
循环)中的每个元素,我在数组l
寻找相应的键并输出当前的内容+ l
值。
但是,由于某种原因,我只能从file1
获取内容(当前的不需要的输出):
data1=data2=data3 some more stuff
data1=data2=data3 some more stuff
data1=data2=data3 some more stuff
data4=data1 this are things
data4=data1 this are things
data2=data5 more text here
data2=data5 more text here
关于我的代码可能有什么问题的任何想法?
非常感谢!
awk
解救!
如果令牌是固定长度的,则可以进行模式匹配而无需拆分字段
$ awk 'NR==FNR{a[$1]=$2;next}
{for(k in a) if($1~k) print $0, a[k]}' file2 file1
data1=data2=data3 some more stuff 10
data1=data2=data3 some more stuff 20
data1=data2=data3 some more stuff 35
data4=data1 this are things 10
data4=data1 this are things 15
data2=data5 more text here 20
data2=data5 more text here 60
我自己找到了答案。 这是变量命名的问题。
这是正确的代码:
awk 'NR==FNR {
l[$1] = $2; next
} {
la=split($1,a,"=")
for(x=1;x<=la;x++)
print $0,l[a[x]]
}' file2 file1 > output
该键位于打印功能中。 现在print $0,l[a[x]]
它读取print $0,l[a[x]]
而不是print $0,l[a[$x]]
。 循环使用x
作为其内部计数器,而不是$x
。 现在将其更改指向数组l
的正确键(来自file2
)。
我要离开该职位,因为看起来以前没有提出过这个问题。 请告诉我您是否认为这没有用。
谢谢!
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.