![](/img/trans.png)
[英]Hadoop: Measuring the duration of each phase(map, shuffle/sort, reduce)
[英]Hadoop: Measuring shuffle time from JAVA
有沒有辦法使用Hadoop API(Hadoop 1.2.1)從客戶端獲取每個reduce任務所需的shuffle時間。 我可以使用getReduceTaskReports(JobID jobID)方法從JobClient獲取reduce任務的執行時間,但我想知道是否有辦法獲得與shuffle時間相對應的百分比。 提前致謝。
該問題的解決方案是使用Apache Rumen( http://hadoop.apache.org/docs/r1.2.1/rumen.html )。 此框架使您能夠以JSON格式檢索作業歷史記錄日志,通過簡單的JSON解析,我能夠檢索所需的信息。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.