[英]word count in spark-scala for rdd(String,String,Long)
我是Spark-scala的新手,试图解决简单的字数统计(具有多个属性作为键)。 我可以得到一些输入吗? 我有一个Rdd(String,String,Long)像(a,b,1)(a,c,1)(a,c,1)(b,b,1)(b,b,1)
期望的结果是rdd如(a,b,1)(a,c,2)(b,b,2)
尝试:
rdd.map {
case (x, y, c) => ((x, y), c)
}.reduceByKey(_ + _)
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.