簡體   English   中英

Amazon Redshift中的列式數據庫查詢

[英]Columnar database queries in Amazon Redshift

我正在學習Amazon Redshift。 聽說它是雲上非常強大的存儲,並且由於需要按列存儲數據,因此在需要聚合操作的數據上運行非常快。

找不到任何示例查詢嗎? 有人可以與我分享一些在Amazon Redshift上運行的匯總查詢示例嗎? 它與正態關系數據庫查詢不同嗎?

您是正確的-Amazon Redshift是一個列狀數據庫 這意味着數據按列存儲在磁盤上,因此對列的操作非常快。 例如,在“國家/地區”列中為特定值添加“銷售”列僅需要訪問兩列,而無需訪問表中的所有列。

其他好處是Redshift中的數據被壓縮 (這與列式概念很好地工作,因為每個列都基於存儲的數據使用自己的壓縮方法),並且它是集群數據庫 ,因此可以通過以下方式擴展計算和存儲的規模:添加其他節點。

Amazon Redshift將自身表示為PostgreSQL數據庫 ,因此您只需使用行業標准的SQL查詢數據即可。 無需更改查詢。

但是,您可以通過明智地為每個表選擇一個確定表中數據分配方式的表的“ 分配鍵 ”,並仔細選擇“ 排序鍵 ”來確定數據在每個節點上的存儲方式,從而優化Redshift。 簡而言之,數據應通過JOIN表的方式進行分配,並應按WHERE語句中的使用方式進行排序。

至於樣本查詢 ...這完全取決於您的數據! 查詢看起來與普通SQL完全相同

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM