[英]Hive statistics
我正在尝试计算ORC文件的统计信息,但我无法看到PART_COL_STATS的任何更改以及使用
set hive.compute.query.using.stats=true;
set hive.stats.reliable=true;
set hive.stats.fetch.column.stats=true;
set hive.stats.fetch.partition.stats=true;
set hive.cbo.enable=true;
获取列的最大值它正在运行完全Map减少列..我想要使用的是存储在元存储中的最大值,但我无法捕获这些统计信息。
我的表格是:
load_inst_id int
src_filename string
server_date date
我的分析查询是:
analyze table mytable partition(server_date=’2013-11-30′) compute statistics for columns load_inst_id;
我总是得到0作为loadinstant id,我必须关闭我的hive.compute.query.using.stats
以获得正确的结果(通过map reduce max(load_inst_id))
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.