繁体   English   中英

如何在雪花中生成表和表列的统计信息?

[英]How to generate statistics of a table and columns of a table in snowflake?

是否有任何 function 可用,例如在 Netezza 中生成统计信息以在雪花中生成列元数据(重复项、唯一值、最小值、最大值等)。

不,不是。

您有包含大小(存储)和行数的TABLES视图
但是信息(包括COLUMNS View )的 rest 与模式元数据有关,而不是与数据元数据有关。

另一方面,表结构本身(又名微分区)包含表元数据,这使得例如MIN()MAX()函数非常高效。 某些表统计信息可能会全局缓存(即在Snowflake 架构的云服务部分)

感谢您提出有关在雪花中收集统计数据的问题。 一些信息:

  1. 在数据加载期间(所有 DML,如 COPY、INSERT/UPDATE/DELETE),Snowflake 已经在微分区级别自动收集这些统计信息。
  2. 在查询处理期间,我们的优化器会自动利用这些统计信息来提高查询性能。
  3. 自动后台服务,如自动集群服务(如果为给定表启用)也将持续和增量地使用这些统计信息微调表的集群质量。

所有这些自动魔术功能都无需用户手动干预(因此 Snowflake 被称为自我调整、易于使用的数据仓库平台)。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM