[英]Tuple as a key in Hadoop mapper
我需要在mapreduce作业中使用2个元素的“元组”作为键。
即我希望我的地图任务输出一对(first_key,second_key), value
我尝试使用ArrayWritable
,但在运行我的代码之后我遇到了一个错误,结果发现ArrayWritable
不适合这样的任务,因为它没有实现WritableComparable
(无论它意味着什么)所以不能用作密钥。
奇怪的是,我无法为我的问题找到任何“正确”的解决方案,它可以100%工作而不附加任何字符串。 有什么建议?
MapReduce作业中的任何键都必须实现WritableComparable ,而不是ArrayWritable
的情况。
它也必须是可Comparable
以便Hadoop可以对(键,值)对进行排序。 所以在你的情况下,解决方案可能是创建自己的类来实现WritableComparable
。
如果您不想实现WritableComparable
,可以使用new Text(key1.toString() + "\\t" + key2.toString())
作为键。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.