[英]Oozie for multiple mapreduce jobs
我有一系列需要運行的mapreduce作業。 我想知道使用Oozie而不是擁有將運行該序列的“一個大驅動程序”是否有任何優勢?
我知道Oozie可用於運行不同類型的多個動作,例如Pig腳本,Shell腳本,Mr job,但是我特別感興趣的是我應該拆分兩個作業並使用Oozie運行它們,還是只用一個jar來做那?
Oozie是一個調度程序-原始的,文獻記錄很少,但是是一個調度程序。
...好吧,不要使用調度程序。
PS:您還有Luigi (Spotify)和Azkaban (LinkedIn)作為替代Hadoop調度程序。
[編輯]要考慮的其他要點:如果您的“驅動程序”由於任何原因崩潰,則您可能沒有機會發送警報; 但是如果從Oozie運行,則最終將檢測到崩潰(在極端情況下,可能需要多達30分鍾的時間,例如,由於YARN RM故障轉移而導致AM作業自毀)
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.