簡體 English 中英

如何配置Hive在Google Dataproc上使用Spark執行引擎？

[英]How to configure Hive to use Spark execution engine on Google Dataproc?

原文 2017-04-10 12:01:03 3 1 apache-spark/ hive/ google-cloud-dataproc

我正在嘗試配置在Google Dataproc映像v1.1（因此Hive 2.1.0和Spark 2.0.2）上運行的Hive，以將Spark用作執行引擎，而不是默認的MapReduce引擎。

按照此處的說明https://cwiki.apache.org/confluence/display/Hive/Hive+on+Spark%3A+Getting+Started並沒有真正的幫助，我一直在Error running query: java.lang.NoClassDefFoundError: scala/collection/Iterable我設置hive.execution.engine=spark時出現Error running query: java.lang.NoClassDefFoundError: scala/collection/Iterable錯誤。

有誰知道在Dataproc上運行它的具體步驟？ 據我所知，這應該是使Hive看到正確的JAR的問題，因為Hive和Spark均已在群集上安裝和配置，並且使用Spark的Hive（反之亦然）也可以正常工作。

1 個解決方案

這可能不適用於Dataproc集群中的jar。 在Dataproc中，Spark使用Hive捆綁（-Phive）進行編譯，Hive on Spark不建議/不支持。

如果您真的想在Spark上運行Hive，則可能需要嘗試將自己的Spark引入如Wiki中所述編譯的初始化操作中。

如果只想在運行Tez的Dataproc上從MapReduce上運行Hive，則使用此初始化操作可能會更容易。

使用 Spark 執行引擎時如何配置 Hive cli？

[英]How to configure the Hive cli when using the Spark execution engine?

Spark 作為 Hive 的執行引擎

[英]Spark as execution engine with Hive

如何配置Hive使用Spark？

[英]How to configure Hive to use Spark?

Hive on Spark和作為Hive執行引擎的Spark：有什么區別

[英]Hive on Spark and Spark as hive execution engine: What's the difference

將Spark設置為Hive的默認執行引擎

[英]Setting Spark as default execution engine for Hive

無法將 Spark 制作為 Hive 執行引擎

[英]Not able to make Spark as Hive execution engine

如何在 google dataproc 上運行 spark 3.2.0？

[英]How to run spark 3.2.0 on google dataproc?

蜂巢執行引擎-Spark-無法創建Spark客戶端

[英]hive execution engine - Spark - Failed to create spark client

如何獲得使用Google Cloud DataProc群集上所有可用資源的火花作業？

[英]How do I get a spark job to use all available resources on a Google Cloud DataProc cluster?

如何在 Google Dataproc 主節點上啟用 pyspark HIVE 支持

[英]How to enable pyspark HIVE support on Google Dataproc master node

暫無

暫無

聲明:本站的技術帖子網頁，遵循CC BY-SA 4.0協議，如果您需要轉載，請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

相關問題 使用 Spark 執行引擎時如何配置 Hive cli？ Spark 作為 Hive 的執行引擎如何配置Hive使用Spark？ Hive on Spark和作為Hive執行引擎的Spark：有什么區別將Spark設置為Hive的默認執行引擎無法將 Spark 制作為 Hive 執行引擎如何在 google dataproc 上運行 spark 3.2.0？蜂巢執行引擎-Spark-無法創建Spark客戶端如何獲得使用Google Cloud DataProc群集上所有可用資源的火花作業？如何在 Google Dataproc 主節點上啟用 pyspark HIVE 支持

相關標簽

粵ICP備18138465號 © 2020-2024 STACKOOM.COM