繁体   English   中英

使用BASH在基于公共列的文本中跨多行连接列

[英]join columns across multiple lines in a Text based on common column using BASH

我有一个像下面的文件。

Table1|Column1
Table2|Column1
Table5|Column1
Table3|Column2
Table2|Column2
Table4|Column3
Table2|Column3
Table2|Column4
Table5|Column4
Table2|Column5 

如果列1中的表名具有相同的属性,我试图从下面的文件中生成一个动态SQL JOIn

select * from Table1 a inner join Table2 b on a.Column1=b.column1 inner join Table5 c on a.Column1=c.column1 

select * from Table3 a inner join Table2 b on a.column2 = b.column2 

..etc到文件结尾

最好的方法是什么,请告知。

请注意,同一列可以出现在2个以上的表中(例如最多20个表,那么联接将重复19次)

这不是一个完整的答案。 但是,我认为您可以使用此答案作为垫脚石来解决问题。

我们使用GNU awk进行解析。 为了提高可读性,我们使用脚本文件parse.awk而不是一个长命令。

# parse.awk
{ a[$2][$1] };
END {
    for (col in a) {
        printf "%s", col;
        for (tab in a[col])
            printf "|%s", tab;
        print ""
    }
}

当我们调用脚本时...

awk -F\| -f parse.awk yourFile

...在您的示例中,输出为

Column1|Table5|Table1|Table2
Column2|Table2|Table3
Column3|Table2|Table4
Column4|Table5|Table2
Column5|Table2

从那里您应该能够构建SQL命令。 您甚至可以修改parse.awk来直接生成SQL命令。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM