繁体   English   中英

将数据框列转换为 spark scala 中的逗号分隔值

[英]Convert dataframe column to a comma separated value in spark scala

我有一个如下的数据框

我的数据框 我希望输出像

预期产出

基本上它应该根据 TPID 进行分组,并以逗号分隔值给出个人角色,如第二个图所示。

您可以使用以下功能:

import org.apache.spark.sql.functions._

//read data in inputDF
inputDF.groupBy("Tpid")
      .agg(concat_ws(",", collect_list("PersonalRole")).alias("PersonalRole"))
      .select(col("Tpid"), col("PersonalRole"))

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM