[英]Pyspark inner join 3 tables
我的目標是加入 Pyspark 數據框中的 3 個表,
TableA
、 TableB
和TableC
都有一個ID,就像一個要合並的Key。
我想加入三個表並創建一個新的 Pyspark dataframe。
你有什么建議嗎?
您可以簡單地加入他們,如下所示:
final_table = (tableA.join(tableB, on = [tableA.ID == tableB.ID], how = 'inner')
.join(tableC, on = [tableA.ID == tableB.ID], how = 'inner'))
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.