[英]What is the difference between 'Hive on Spark mode' and 'Spark SQL'? Will 'Hive on Spark mode' uses Catalyst Optimizer?
Hive on Spark与通过HiveContext使用Spark SQL运行Hive查询不同。 它不会将查询转换为Spark原语,而是将其转换为MapReduce原语并在Spark上执行,其主要目的是利用Spark执行引擎,而不影响Hive中的现有代码。
在内部,它将Hive的逻辑运算符转换为Spark任务,这些任务主要是RDD转换和操作,并且尚未使用Dataframe(根据官方文档),因此它不使用Tungsten或Catalyst Optimizer。
以下文档提到了官方文档中有关Hive on Spark的所有设计注意事项-
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.