繁体   English   中英

跨多个字段收集给定键的值 - Apache Spark (Scala)

[英]Collecting values across multiple fields for a given key - Apache Spark (Scala)

我有以下格式的 Scala 数据框:

在此处输入图片说明

我需要以下格式的 o/p:
在此处输入图片说明

o/p 需要写入 json 文件。

这里是。 根据您的需要更改格式。

import org.apache.spark.sql.functions._
df.withColumn("arr", format_string("{%d,%d,%d}", $"pd_id", $"score",$"rank"))
.groupBy("event_tra", "customer", "itemId", "ckey").agg(collect_list("arr").as("collection"))
.select(format_string("{%s,%s,%s,%s,%s,%s}", $"event_tra", $"customer", $"itemId", $"ckey", col("collection").toString).as("data"))

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM