[英]Separate output per file in Hadoop and Amazon EMR/S3
我正在從事一個使用Hadoop分析書中單詞的項目。 我有一個類似於標准單詞計數示例的程序( 請參見此處 )。 該程序當前對目錄中所有文件中的所有單詞進行計數,並將其組合在一起。 但是,我還需要獲得一個單詞計數和每個處理過的文件的單獨輸出,或者至少需要一些能給我每個文件的單詞計數的東西。 我怎樣才能做到這一點?
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.