簡體   English   中英

如何在雪花中生成表和表列的統計信息?

[英]How to generate statistics of a table and columns of a table in snowflake?

是否有任何 function 可用,例如在 Netezza 中生成統計信息以在雪花中生成列元數據(重復項、唯一值、最小值、最大值等)。

不,不是。

您有包含大小(存儲)和行數的TABLES視圖
但是信息(包括COLUMNS View )的 rest 與模式元數據有關,而不是與數據元數據有關。

另一方面,表結構本身(又名微分區)包含表元數據,這使得例如MIN()MAX()函數非常高效。 某些表統計信息可能會全局緩存(即在Snowflake 架構的雲服務部分)

感謝您提出有關在雪花中收集統計數據的問題。 一些信息:

  1. 在數據加載期間(所有 DML,如 COPY、INSERT/UPDATE/DELETE),Snowflake 已經在微分區級別自動收集這些統計信息。
  2. 在查詢處理期間,我們的優化器會自動利用這些統計信息來提高查詢性能。
  3. 自動后台服務,如自動集群服務(如果為給定表啟用)也將持續和增量地使用這些統計信息微調表的集群質量。

所有這些自動魔術功能都無需用戶手動干預(因此 Snowflake 被稱為自我調整、易於使用的數據倉庫平台)。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM