[英]Apache Flink - groupBy
我正在尝试遵循http://dataartisans.github.io/flink-training/exercises/上的第一个练习。
现在我来解决以下问题。 groupBy
函数给了我什么? foldLeft
方法如何转换 - 对我来说未知 - 结果?
代码如下:
mails.map {
m => (m._1.substring(0, 7), m._2.substring(m._2.lastIndexOf("<") + 1, m._2.length - 1))
}
.groupBy(0, 1)
.reduceGroup( ms => ms.foldLeft("", "", 0)( (c, m) => (m._1, m._2, c._3 + 1) ) )
问候, 凯文
groupBy
返回分组数据集: https : groupBy
foldLeft
定义折叠(或减少)顺序。 请参阅此处: https : //en.wikipedia.org/wiki/Fold_%28higher-order_function%29
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.