繁体   English   中英

Amazon Redshift中的列式数据库查询

[英]Columnar database queries in Amazon Redshift

我正在学习Amazon Redshift。 听说它是云上非常强大的存储,并且由于需要按列存储数据,因此在需要聚合操作的数据上运行非常快。

找不到任何示例查询吗? 有人可以与我分享一些在Amazon Redshift上运行的汇总查询示例吗? 它与正态关系数据库查询不同吗?

您是正确的-Amazon Redshift是一个列状数据库 这意味着数据按列存储在磁盘上,因此对列的操作非常快。 例如,在“国家/地区”列中为特定值添加“销售”列仅需要访问两列,而无需访问表中的所有列。

其他好处是Redshift中的数据被压缩 (这与列式概念很好地工作,因为每个列都基于存储的数据使用自己的压缩方法),并且它是集群数据库 ,因此可以通过以下方式扩展计算和存储的规模:添加其他节点。

Amazon Redshift将自身表示为PostgreSQL数据库 ,因此您只需使用行业标准的SQL查询数据即可。 无需更改查询。

但是,您可以通过明智地为每个表选择一个确定表中数据分配方式的表的“ 分配键 ”,并仔细选择“ 排序键 ”来确定数据在每个节点上的存储方式,从而优化Redshift。 简而言之,数据应通过JOIN表的方式进行分配,并应按WHERE语句中的使用方式进行排序。

至于样本查询 ...这完全取决于您的数据! 查询看起来与普通SQL完全相同

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM