[英]sequential and parallel execution of map reduce
我对Hadoop很陌生,在以下情况下需要帮助。 假设有5个MR工作
P1(MR1+ MR2 ) -->// MR1 and MR2 run sequentially
P2(MR3+MR4)// // MR3 and MR4 run sequentially
and P1 and P2 run parallel way .Output of P1 and P2 will be joined By MR5.
我如何在hadoop中定义这种复杂的工作流程?
如果您有更复杂的要求,则应查看Oozie: Oozie
对于简单的要求,您可以在Job API中使用“依赖关系管理”。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.