[英]Join Dataframes in Spark
我使用以下代碼在Spark中加入了兩個數據框-
數據幀是:expDataFrame,accountList
val expDetails = expDataFrame.as("fex").join(accountList.as("acctlist"),$"fex.acct_id" === $"acctlist.acct_id", "inner")
現在,我試圖顯示兩個數據幀中的兩個acct_id 。
我已經完成了以下代碼-
expDetails.select($"fex.acct_id",$"acct_id.acct_id").show
但是獲得相同的列名稱兩次作為acct_id
我想要兩個唯一的列名稱,例如fex_acct_id,acctlist_acct_id,以標識來自哪個數據幀的列。
您只需使用as
或alias
方法將別名添加到列中。 這將完成工作:
expDetails.select(
$"fex.acct_id".as("fex_acct_id"),
$"acct_id.acct_id".as("acctlist_acct_id")
).show
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.