繁体   English   中英

Pyspark inner join 3张表

[英]Pyspark inner join 3 tables

我的目标是加入 Pyspark 数据框中的 3 个表,

TableATableBTableC都有一个ID,就像一个要合并的Key。

我想加入三个表并创建一个新的 Pyspark dataframe。

你有什么建议吗?

您可以简单地加入他们,如下所示:

final_table = (tableA.join(tableB, on = [tableA.ID == tableB.ID], how = 'inner')
                     .join(tableC, on = [tableA.ID == tableB.ID], how = 'inner'))

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM