[英]Pyspark inner join 3 tables
我的目标是加入 Pyspark 数据框中的 3 个表,
TableA
、 TableB
和TableC
都有一个ID,就像一个要合并的Key。
我想加入三个表并创建一个新的 Pyspark dataframe。
你有什么建议吗?
您可以简单地加入他们,如下所示:
final_table = (tableA.join(tableB, on = [tableA.ID == tableB.ID], how = 'inner')
.join(tableC, on = [tableA.ID == tableB.ID], how = 'inner'))
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.