[英]Why multiple MapReduce jobs for one pig / Hive job?
Templeton Controller Job就像是Parent作业,它将调用另一个子map-reduce作业。 基本上是控制执行。
在执行之前,Pig基本上提出了一个执行计划-在其中扫描Pig脚本中的所有步骤,并合并可以在单个作业中执行的步骤。 当Pig脚本中有两个步骤无法在单个作业中计算时,它将分为两个步骤。 完成合并并计算出每个作业的作业数量和步骤以得出最终结果后,它将开始执行。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.