![](/img/trans.png)
[英]Can we cascade multiple MapReduce jobs in Hadoop Streaming (lang: Python)
[英]How to iterate MapReduce in Hadoop? (lang: python)
我編寫了一個MapReduce程序(mapper.py和reducer.py)來處理Hadoop中的PageRank問題。
我想迭代MapReduce約10次迭代。 如何將第一輪MapReduce的輸出帶到第二輪MapReduce的輸入?
1 2 10
[mapper->reducer] -> [mapper->reducer] -> ... -> [mapper->reducer] -> final result
您可以將job1的輸出鏈接為job2的輸入。
輸入目錄1->輸出目錄1->輸出目錄2 ...->輸出目錄9->輸出目錄10
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.