![](/img/trans.png)
[英]How to configure the Hive cli when using the Spark execution engine?
[英]How to configure Hive to use Spark execution engine on Google Dataproc?
我正在尝试配置在Google Dataproc映像v1.1(因此Hive 2.1.0和Spark 2.0.2)上运行的Hive,以将Spark用作执行引擎,而不是默认的MapReduce引擎。
按照此处的说明https://cwiki.apache.org/confluence/display/Hive/Hive+on+Spark%3A+Getting+Started并没有真正的帮助,我一直在Error running query: java.lang.NoClassDefFoundError: scala/collection/Iterable
我设置hive.execution.engine=spark
时出现Error running query: java.lang.NoClassDefFoundError: scala/collection/Iterable
错误。
有谁知道在Dataproc上运行它的具体步骤? 据我所知,这应该是使Hive看到正确的JAR的问题,因为Hive和Spark均已在群集上安装和配置,并且使用Spark的Hive(反之亦然)也可以正常工作。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.