簡體   English   中英

在HADOOP映射中使用泛型可減少問題

[英]use of Generics in HADOOP map reduce problems

我的問題對於HADOOP用戶而言似乎很愚蠢。 但是我對在映射減少問題中使用泛型感到困惑,例如“ WORD COUNT”。

我知道,泛型被基本用於類型轉換和類型安全。 但是我不能在這里將這個概念聯系起來。

在字數問題上,

public class WordCountMapper extends
        Mapper<LongWritable, Text, Text, LongWritable> {
    @Override
    protected void map(LongWritable key, Text value, Context context)
            throws IOException, InterruptedException {
        // TODO Auto-generated method stub
        ...

        }
    }

}

請任何人在這里讓我明白泛型的使用 如果我在問這個問題時犯了任何錯誤,請糾正我。

現在,我了解將泛型用於鍵值對(KEY IN,VALUE IN,KEY OUT,VALUE OUT)。 但是我仍然不清楚,為什么在這里將泛型用於鍵值對。 沒有其他方法可以做同樣的事情。 在這里使用泛型有什么好處?

謝謝!

MapReduce在Mapper和Reducer中專門使用泛型來指定期望讀入和寫出哪種輸入和輸出。

在該示例中,您指定了WordCountMapper以指定的泛型Mapper<LongWritable, Text, Text, LongWritable>擴展了Mapper類,其中前兩個類LongWritableText表示Mapper類期望讀取的輸入鍵和值 ,而后兩個TextLongWritable類表示map方法應發出的輸出鍵和值類。

通過該線程討論,可以更深入地了解為什么在MapReduce中實現了泛型。 另外,此JIRA問題提供了更多信息。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM