[英]How do I get each reduce task's execution time programmatically in Hadoop?
我正在hadoop中运行一个简单的map reduce作业,在Java中,我可以使用System.currentTimeInMillis()
函数来计算开始时间和结束时间,在mapreduce中,我该如何为地图(endTime-startTime)完成此功能,reduce( endTime-startTime)。 我尝试了以下代码..并set job.setNumReduceTasks(4)
编辑:
public void reduce(Text _key, Iterable<IntWritable> values, Context context)
throws IOException, InterruptedException {
// process values
long start=System.currentTimeMillis();
int sum=0;
for (IntWritable val : values) {
sum+=val.get();
}
result.set(sum);
context.write(_key, result);
long end=System.currentTimeMillis();
System.out.println(" time Taken "+(end-start));
}
但结果是:
time Taken 1
time Taken 0
time Taken 0
time Taken 0
time Taken 0
time Taken 0
time Taken 0
time Taken 0
time Taken 0
time Taken 0
----------
----------
但我将reduce任务的数量设置为4 ..并且这里显示了执行每个键值对所花费的时间。
添加setup()方法和cleanup()方法之后。
public void run(Context context) throws IOException, InterruptedException {
start=System.currentTimeMillis();
setup(context);
try {
while (context.nextKey()) {
reduce(context.getCurrentKey(), context.getValues(), context);
}
} finally {
cleanup(context);
end=System.currentTimeMillis();
System.out.println(" End- Start : "+(end-start));
}
}
public void reduce(Text _key, Iterable<IntWritable> values, Context context)
throws IOException, InterruptedException {
int sum=0;
for (IntWritable val : values) {
sum+=val.get();
}
result.set(sum);
context.write(_key, result);
}
我已经使用job.setNumReduceTasks(4)
将reducer的数量设置为4。 但是它只显示一个时间戳。.我在这里做错什么了吗...
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.