[英]How to pass Hive set parameters in oozie workflow
無論如何要傳遞Hive參數,例如
設置hive.exec.parallel = true; SET hive.vectorized.execution.enabled = true;
使用參數文件使用oozie工作流程
這取決於您調用配置單元查詢(hql)文件的方式。
如果在工作流中使用配置單元操作,則可以在配置部分的屬性標簽內或hql文件myscript.q內指定配置單元配置參數。
<workflow-app name="sample-wf" xmlns="uri:oozie:workflow:0.1">
...
<action name="myfirsthivejob">
<hive xmlns="uri:oozie:hive-action:0.2">
<job-traker>foo:9001</job-tracker>
<name-node>bar:9000</name-node>
<prepare>
<delete path="${jobOutput}"/>
</prepare>
<configuration>
<property>
<name>hive.exec.parallel</name>
<value>true</value>
</property>
</configuration>
<script>myscript.q</script>
<param>InputDir=/home/tucu/input-data</param>
<param>OutputDir=${jobOutput}</param>
</hive>
<ok to="myotherjob"/>
<error to="errorcleanup"/>
</action>
...
</workflow-app>
如果使用oozie shell操作,則可以在shell腳本中按以下方式指定配置單元參數。
hive --hiveconf "<hive queries>"
要么
hive --hiveconf -f "hivequeries.hql"
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.