[英]Redshift table size identification based on date
我想在 redshift 中創建一個查詢,我想between 25-07-2021 and 24-09-2022
傳遞日期,並希望獲得這些日期之間特定表的 MB(表大小)結果。
我假設通過“以 MB 為單位獲取結果”你說,如果這些匹配的行都放在一個新表中,你想知道該表將占用多少 MB。
根據每列的特定壓縮類型,數據以不同的方式存儲在 Amazon Redshift 中,因此磁盤上的存儲空間特定於所存儲的實際數據。
知道這些行將占用多少磁盤空間的唯一方法是實際創建一個包含這些行的表。 不可能以任何其他方式准確預測存儲。
當然,您可以通過計算與日期匹配的行數,然后將其作為整個表大小的比例來獲得近似值。 例如,如果表包含 1m 行並且數據匹配 50,000 行,那么它們將表示50/1000
(5%)。 然而,這並不是一個完全准確的衡量標准。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.