[英]CLUSTER BY on String in Hive
我在蜂巢中有以下查询
CREATE TABLE bucketed_users (id INT, name STRING,FlatNumber INT)
CLUSTERED BY (id) INTO 4 BUCKETS;
只能仅在INT列上(也可以在FlatNumber
)进行聚类吗?还是可以定义自定义函数,该函数将提供将逻辑划分为存储桶的功能?
群集/存储桶可以在任何列上创建,对于非数字列,HIVE将使用HASH(col)%“存储桶数”查找记录的存储桶。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.