簡體 English 中英

Oozie中的MapReduce作業可以從文件中讀取嗎？

[英]Can a MapReduce job in Oozie read from a file?

原文 2015-08-05 08:31:33 4 1 hadoop/ mapreduce/ oozie

在Oozie中創建工作流程時，我首先執行了Java步驟，該步驟將生成一個文件，其中包含下一步所需的文件列表（map-reduce）。 我如何用該文件來提供地圖縮減工作？

我知道我可以在java步驟的Capture輸出框中打鈎，然后在map-reduce步驟中使用mapred.input.dir將該捕獲的輸出用作輸入。 但是我想讓自己脫離這一點。

僅作記錄，我文件的內容如下：

/data/kafka/4/camus/DATA.TRADE.ORDERHISTORY/daily/2015/07/18,/data/kafka/4/camus/DATA.TRADE.ORDERHISTORY/daily/2015/07/19,/data/kafka /4/camus/DATA.TRADE.ORDERHISTORY/daily/2015/07/20,/data/kafka/4/camus/DATA.TRADE.ORDERHISTORY/daily/2015/07/21,/data/kafka/4/camus /DATA.TRADE.ORDERHISTORY/daily/2015/07/22,/data/kafka/4/camus/DATA.TRADE.ORDERHISTORY/daily/2015/07/23,/data/kafka/4/camus/DATA.TRADE .ORDERHISTORY /每日/ 2015/07/24，/數據/卡夫卡/ 4 /加繆/ DATA.TRADE.ORDERHISTORY /每日/ 2015/07/25，/數據/卡夫卡/ 4 /加繆/ DATA.TRADE.ORDERHISTORY每日/ /2015/07/26,/data/kafka/4/camus/DATA.TRADE.ORDERHISTORY/daily/2015/07/27,/data/kafka/4/camus/DATA.TRADE.ORDERHISTORY/daily/2015/07 / 28

1 個解決方案

您要將該文件用作輸入文件還是參數文件 ？

在第二種情況下

為初始操作激活<capture-output />選項
輸出類似“ param.file = / a / b / c / z.txt”的內容
在下一個操作中，使用適當的EL函數來檢索文件名，並將其作為<property>或<env>傳遞
$ {WF：actionData（ “InitialActionName”）[ “param.file”]}
然后使用幾行Java來打開該HDFS文件，並在執行實際的Map或Reduce工作之前執行對內容的任何處理

在Oozie中運行MapReduce作業

[英]Running MapReduce job in Oozie

Oozie協調員。如何將數據從過去提供給mapreduce工作？

[英]Oozie coordinator. HowTo feed data from past to mapreduce job?

在沒有Oozie的情況下定期運行MapReduce作業？

[英]Running MapReduce job periodically without Oozie?

如何在不重啟 oozie 作業的情況下重新加載 oozie 作業配置文件

[英]How can I reload oozie job configuration file without restart oozie job

在hue中使用oozie工作流執行MapReduce作業，給出錯誤的輸出

[英]Executing MapReduce job using oozie workflow in hue giving wrong output

在 Oozie 工作流中的 MapReduce 作業中設置 Reducer 數量

[英]Setting the Number of Reducers in a MapReduce job which is in an Oozie Workflow

MapReduce從任務中的類路徑讀取文件

[英]MapReduce read file from classpath in Tasks

從系統讀取文本文件到Hbase MapReduce

[英]Read text file from System to Hbase MapReduce

我可以從AWS Elastic Mapreduce作業訪問Zookeeper嗎

[英]Can I access zookeeper from AWS Elastic Mapreduce job

如何從R中的流mapreduce作業中獲取文件名？

[英]How can to get the filename from a streaming mapreduce job in R?

暫無

暫無

聲明:本站的技術帖子網頁，遵循CC BY-SA 4.0協議，如果您需要轉載，請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

相關問題 在Oozie中運行MapReduce作業 Oozie協調員。如何將數據從過去提供給mapreduce工作？在沒有Oozie的情況下定期運行MapReduce作業？如何在不重啟 oozie 作業的情況下重新加載 oozie 作業配置文件在hue中使用oozie工作流執行MapReduce作業，給出錯誤的輸出在 Oozie 工作流中的 MapReduce 作業中設置 Reducer 數量 MapReduce從任務中的類路徑讀取文件從系統讀取文本文件到Hbase MapReduce 我可以從AWS Elastic Mapreduce作業訪問Zookeeper嗎如何從R中的流mapreduce作業中獲取文件名？

相關標簽

粵ICP備18138465號 © 2020-2024 STACKOOM.COM