繁体   English   中英

分区表上的配置单元查询速度很慢

[英]Hive query on a bucketed table is slow

我有2张桌子。
一个桶装了,另一个桶装了-除了它们是相同的。
两者都存储为orc和分区。
在给定分区上查询存储桶表比在同一分区上查询其孪生表慢得多。
是预期的吗?
如果没有,原因可能是什么?
如果是,那么我是否应该得出结论,持有存储桶表的唯一动机是为了进行联接和采样,在这种情况下,要保存该表的2个副本-一个存储桶,而另一个则不行(听起来很浪费)?

当前,HIVE不支持where子句中与存储桶相关的查询优化。 不过,在联接操作期间进行存储桶操作将是有益的。 在上述用例中,Partition和ORC以及按排序顺序存储的DATA应该给您最佳的响应。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM