[英]Amazon elasticsearch interpretation of FreeStorageSpace metrics
我对此也感到困惑。 最小均值表示单个数据节点上的大小-空闲空间最少的节点。 总和表示整个群集的大小(所有数据节点上的可用空间的总和)。 通过以下链接获得了此信息
http://docs.aws.amazon.com/elasticsearch-service/latest/developerguide/es-managedomains.html
我们遇到了同样的困惑。 平均,最小值,最大值将计算结果分布在所有节点上,总和将整个集群的可用/已用空间合并在一起。
我们假设平均FreeStorageSpace意味着整个集群的平均可用存储空间,并设置了一个警报,牢记以下计算:
因此,我们在任何时间点的平均利用率均为10 TB。 假设,按照https://docs.aws.amazon.com/elasticsearch-service/latest/developerguide/sizing-domains.html#aes-bp-storage进行复制,我们将实际存储量提高2倍,即20 TB 2的系数是:
(20 * 2 * 1.1 / 0.95 / 0.8)= 57.89 =〜60 TB
因此,我们将18 X 3.8 TB实例=〜68 TB调配为2x = 60 TB
因此,我们设置了一个警报,即如果我们将可用存储空间降至8 TB以下-这意味着我们已达到2倍的限制并应扩大规模。 因此,我们设置了警报
FreeStorageSpace <= 8388608.00在5分钟内获得4个数据点+统计=平均+持续时间= 1分钟
FreeStorageSpace的大小为MB,因此-8 TB = 8388608 MB。
但是我们立即收到警报,因为我们每个节点的平均利用率低于8 TB。
意识到要获得准确的存储后,您需要做FreeStorageSpace sum 1分钟-我们将警报设置为
FreeStorageSpace <= 8388608.00在5分钟内获得4个数据点+统计=总和+持续时间= 1分钟
以上计算已签出,我们可以设置正确的警报。
ClusterUsedSpace计算也是如此。
您还应该使用Cloudwatch Math跟踪实际可用空间百分比:
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.