繁体   English   中英

在HADOOP映射中使用泛型可减少问题

[英]use of Generics in HADOOP map reduce problems

我的问题对于HADOOP用户而言似乎很愚蠢。 但是我对在映射减少问题中使用泛型感到困惑,例如“ WORD COUNT”。

我知道,泛型被基本用于类型转换和类型安全。 但是我不能在这里将这个概念联系起来。

在字数问题上,

public class WordCountMapper extends
        Mapper<LongWritable, Text, Text, LongWritable> {
    @Override
    protected void map(LongWritable key, Text value, Context context)
            throws IOException, InterruptedException {
        // TODO Auto-generated method stub
        ...

        }
    }

}

请任何人在这里让我明白泛型的使用 如果我在问这个问题时犯了任何错误,请纠正我。

现在,我了解将泛型用于键值对(KEY IN,VALUE IN,KEY OUT,VALUE OUT)。 但是我仍然不清楚,为什么在这里将泛型用于键值对。 没有其他方法可以做同样的事情。 在这里使用泛型有什么好处?

谢谢!

MapReduce在Mapper和Reducer中专门使用泛型来指定期望读入和写出哪种输入和输出。

在该示例中,您指定了WordCountMapper以指定的泛型Mapper<LongWritable, Text, Text, LongWritable>扩展了Mapper类,其中前两个类LongWritableText表示Mapper类期望读取的输入键和值 ,而后两个TextLongWritable类表示map方法应发出的输出键和值类。

通过该线程讨论,可以更深入地了解为什么在MapReduce中实现了泛型。 另外,此JIRA问题提供了更多信息。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM