簡體   English   中英

如何在Hadoop中迭代MapReduce? (lang:python)

[英]How to iterate MapReduce in Hadoop? (lang: python)

我編寫了一個MapReduce程序(mapper.py和reducer.py)來處理Hadoop中的PageRank問題。

我想迭代MapReduce約10次迭代。 如何將第一輪MapReduce的輸出帶到第二輪MapReduce的輸入?

       1                    2                           10
[mapper->reducer] -> [mapper->reducer] -> ... -> [mapper->reducer] -> final result

您可以將job1的輸出鏈接為job2的輸入。

輸入目錄1->輸出目錄1->輸出目錄2 ...->輸出目錄9->輸出目錄10

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM