[英]What is the difference between 'Hive on Spark mode' and 'Spark SQL'? Will 'Hive on Spark mode' uses Catalyst Optimizer?
Hive on Spark與通過HiveContext使用Spark SQL運行Hive查詢不同。 它不會將查詢轉換為Spark原語,而是將其轉換為MapReduce原語並在Spark上執行,其主要目的是利用Spark執行引擎,而不影響Hive中的現有代碼。
在內部,它將Hive的邏輯運算符轉換為Spark任務,這些任務主要是RDD轉換和操作,並且尚未使用Dataframe(根據官方文檔),因此它不使用Tungsten或Catalyst Optimizer。
以下文檔提到了官方文檔中有關Hive on Spark的所有設計注意事項-
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.