繁体 English 中英

如何配置Hive在Google Dataproc上使用Spark执行引擎？

[英]How to configure Hive to use Spark execution engine on Google Dataproc?

原文 2017-04-10 12:01:03 7 1 apache-spark/ hive/ google-cloud-dataproc

我正在尝试配置在Google Dataproc映像v1.1（因此Hive 2.1.0和Spark 2.0.2）上运行的Hive，以将Spark用作执行引擎，而不是默认的MapReduce引擎。

按照此处的说明https://cwiki.apache.org/confluence/display/Hive/Hive+on+Spark%3A+Getting+Started并没有真正的帮助，我一直在Error running query: java.lang.NoClassDefFoundError: scala/collection/Iterable我设置hive.execution.engine=spark时出现Error running query: java.lang.NoClassDefFoundError: scala/collection/Iterable错误。

有谁知道在Dataproc上运行它的具体步骤？ 据我所知，这应该是使Hive看到正确的JAR的问题，因为Hive和Spark均已在群集上安装和配置，并且使用Spark的Hive（反之亦然）也可以正常工作。

1 个解决方案

这可能不适用于Dataproc集群中的jar。 在Dataproc中，Spark使用Hive捆绑（-Phive）进行编译，Hive on Spark不建议/不支持。

如果您真的想在Spark上运行Hive，则可能需要尝试将自己的Spark引入如Wiki中所述编译的初始化操作中。

如果只想在运行Tez的Dataproc上从MapReduce上运行Hive，则使用此初始化操作可能会更容易。

使用 Spark 执行引擎时如何配置 Hive cli？

[英]How to configure the Hive cli when using the Spark execution engine?

Spark 作为 Hive 的执行引擎

[英]Spark as execution engine with Hive

如何配置Hive使用Spark？

[英]How to configure Hive to use Spark?

Hive on Spark和作为Hive执行引擎的Spark：有什么区别

[英]Hive on Spark and Spark as hive execution engine: What's the difference

将Spark设置为Hive的默认执行引擎

[英]Setting Spark as default execution engine for Hive

无法将 Spark 制作为 Hive 执行引擎

[英]Not able to make Spark as Hive execution engine

如何在 google dataproc 上运行 spark 3.2.0？

[英]How to run spark 3.2.0 on google dataproc?

蜂巢执行引擎-Spark-无法创建Spark客户端

[英]hive execution engine - Spark - Failed to create spark client

如何获得使用Google Cloud DataProc群集上所有可用资源的火花作业？

[英]How do I get a spark job to use all available resources on a Google Cloud DataProc cluster?

如何在 Google Dataproc 主节点上启用 pyspark HIVE 支持

[英]How to enable pyspark HIVE support on Google Dataproc master node

暂无

暂无

声明:本站的技术帖子网页，遵循CC BY-SA 4.0协议，如果您需要转载，请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

相关问题 使用 Spark 执行引擎时如何配置 Hive cli？ Spark 作为 Hive 的执行引擎如何配置Hive使用Spark？ Hive on Spark和作为Hive执行引擎的Spark：有什么区别将Spark设置为Hive的默认执行引擎无法将 Spark 制作为 Hive 执行引擎如何在 google dataproc 上运行 spark 3.2.0？蜂巢执行引擎-Spark-无法创建Spark客户端如何获得使用Google Cloud DataProc群集上所有可用资源的火花作业？如何在 Google Dataproc 主节点上启用 pyspark HIVE 支持

相关标签

粤ICP备18138465号 © 2020-2024 STACKOOM.COM