繁体   English   中英

Apache Tajo和Apache hive之间的实际区别是什么

[英]What is actual difference between Apache Tajo and Apache hive

最近正在开发Apache Tajo项目 该项目的目标是成为“Hadoop中用于处理Web规模数据集的高级开源数据仓库系统”

由于我们已经将Apache hive作为hadoop的数据仓库,现在已经进步并广泛使用,这个新项目对于hadoop世界有多么有用和不同?

如果您已经在Hive上安装了仓库,我很确定您不必在短期内搬走。 Tajo试图访问的几个区域是:

  1. 低延迟查询(ad-hoc):使用Impala / Tez可能会获得足够快的结果,并且CDH 5.7会带来hive-on-spark。 为了更快的响应,可以使用不同的DB(通常不是DWH)。
  2. 完整的SQL支持:只要使用配置单元的人已经熟悉HQL,就不需要SQL了。 虽然您可以很容易地理解为什么拥有全sql支持是有益的。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM