Scala Spark数据框按字段合并

Question

I have data frame with 5 rows: 我有5行的数据框：

[user,sun,MainTest2,end,false]
[user,sun,MainTest2,start,false]
[user,sun,MainTest,end,true]
[user,sun,MainTest,start,true]
[user,sun,MainTest,start,true]

What i wan't to achieve is 2 aggregated rows with text merged on 4 field: 我将无法实现的是2个聚合行，并在4个字段上合并了文本：

[user,sun,MainTest2,end#some_union_symbol#start,false]
[user,sun,MainTest,end#some_union_symbol#start#some_union_symbol#start,true]

I think I need do something about reduce, but not quite sure. 我认为我需要做一些减少的事情，但还不是很确定。 Thank you! 谢谢！

Answer 1

Only one Answer from all stack that i can find and work with my 1.4.1 spark. 我能找到并使用我的1.4.1 spark的所有堆栈中只有一个Answer 。

sorry, for double post 抱歉，要重复

Scala Spark数据框按字段合并

问题描述

1 个解决方案

解决方案1
0 已采纳 2016-07-12 09:16:29

Scala Spark数据框按字段合并

问题描述

1 个解决方案

解决方案1 0 已采纳 2016-07-12 09:16:29

解决方案1
0 已采纳 2016-07-12 09:16:29