![](/img/trans.png)
[英]How to configure the Hive cli when using the Spark execution engine?
[英]How to configure Hive to use Spark execution engine on Google Dataproc?
我正在嘗試配置在Google Dataproc映像v1.1(因此Hive 2.1.0和Spark 2.0.2)上運行的Hive,以將Spark用作執行引擎,而不是默認的MapReduce引擎。
按照此處的說明https://cwiki.apache.org/confluence/display/Hive/Hive+on+Spark%3A+Getting+Started並沒有真正的幫助,我一直在Error running query: java.lang.NoClassDefFoundError: scala/collection/Iterable
我設置hive.execution.engine=spark
時出現Error running query: java.lang.NoClassDefFoundError: scala/collection/Iterable
錯誤。
有誰知道在Dataproc上運行它的具體步驟? 據我所知,這應該是使Hive看到正確的JAR的問題,因為Hive和Spark均已在群集上安裝和配置,並且使用Spark的Hive(反之亦然)也可以正常工作。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.