簡體 English 中英

通過Hive進行Spark sql的目的是什么？

[英]what's the purpose of spark sql over hive?

原文 2017-10-13 16:31:30 8 1 apache-spark/ hive/ tez

我知道這個問題是在幾年前提出的，但是我仍然想知道使用SparkSQL / HiveContext的真正目的。

與內置MapReduce相比，Spark方法提供了更通用的分布式方式。

我閱讀了許多文章，聲稱MR方法已經死了，而Spark是最好的方法（我知道我可以通過Spark來實現MR方法）。

建議使用HiveContext查詢數據時，我有些困惑。

的確，從SparkSQL / HiveContext運行查詢並不意味着運行MR作業嗎？ 回到主要問題上不是嗎？ 如果我不需要將查詢結果封裝在更復雜的代碼中，那么TEZ還不夠嗎？

我錯了嗎（我確定我是:-)）？

1 個解決方案

的確，從SparkSQL / HiveContext運行查詢並不意味着運行MR作業嗎？

它不是。 實際上，將HiveContext或SparkSession與“ Hive支持”一起使用並不意味着與Hive有任何連接，除了使用Hive Metastore。 ETL解決方案和數據庫等許多其他系統也使用此方法。

最后：

Hive是具有模塊化組件的數據庫。 它支持相對豐富的權限系統，變異和事務。
Spark是通用處理引擎。 盡管具有SQL-ish組件，但它不會嘗試成為數據庫。

為什么火花 sql 優於 hive？

[英]Why spark sql is preferred over hive?

Hive on Spark和作為Hive執行引擎的Spark：有什么區別

[英]Hive on Spark and Spark as hive execution engine: What's the difference

Spark SQL 本機語法和 Spark 中的 Hive QL 語法有什么區別？

[英]what's the difference between Spark SQL native syntax and Hive QL syntax in Spark?

“ Hive on Spark模式”和“ Spark SQL”有什么區別？ “ Hive on Spark模式”會使用Catalyst Optimizer嗎？

[英]What is the difference between 'Hive on Spark mode' and 'Spark SQL'? Will 'Hive on Spark mode' uses Catalyst Optimizer?

在Spark-SQL中避免SQL注入的首選方法是什么（在Hive上）

[英]What is the preferred way to avoid SQL injections in Spark-SQL (on Hive)

spark-submit 中 --files 的目的和用例是什么？

[英]what's the purpose and usecase of --files in spark-submit?

Spark SQL為Hive構建嗎？

[英]Spark SQL build for hive?

Spark上的Spark SQL vs HIVE

[英]Spark SQL vs HIVE on Spark

Spark sql 中的 Hive 查詢

[英]Hive queries in spark sql

通過 Spark SQL 讀取 Hive 表的最佳方法是什么？

[英]What is the best way to read Hive Table through Spark SQL?

暫無

暫無

聲明:本站的技術帖子網頁，遵循CC BY-SA 4.0協議，如果您需要轉載，請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

相關問題 為什么火花 sql 優於 hive？ Hive on Spark和作為Hive執行引擎的Spark：有什么區別 Spark SQL 本機語法和 Spark 中的 Hive QL 語法有什么區別？ “ Hive on Spark模式”和“ Spark SQL”有什么區別？ “ Hive on Spark模式”會使用Catalyst Optimizer嗎？在Spark-SQL中避免SQL注入的首選方法是什么（在Hive上） spark-submit 中 --files 的目的和用例是什么？ Spark SQL為Hive構建嗎？ Spark上的Spark SQL vs HIVE Spark sql 中的 Hive 查詢通過 Spark SQL 讀取 Hive 表的最佳方法是什么？

相關標簽

粵ICP備18138465號 © 2020-2024 STACKOOM.COM