[英]Separate output per file in Hadoop and Amazon EMR/S3
我正在从事一个使用Hadoop分析书中单词的项目。 我有一个类似于标准单词计数示例的程序( 请参见此处 )。 该程序当前对目录中所有文件中的所有单词进行计数,并将其组合在一起。 但是,我还需要获得一个单词计数和每个处理过的文件的单独输出,或者至少需要一些能给我每个文件的单词计数的东西。 我怎样才能做到这一点?
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.