繁体 English 中英

Amazon Elasticsearch对FreeStorageSpace指标的解释

[英]Amazon elasticsearch interpretation of FreeStorageSpace metrics

原文 2016-07-14 19:55:30 3 2 amazon-web-services/ elasticsearch/ logstash/ elastic-stack/ amazon-elasticsearch

我有6个m3.large.elasticsearch类型的实例和存储类型实例。

我真的不明白这里的平均，最小，最大..意味着什么？

尽管这里显示FreeStorageSpace为14.95GB，但我现在没有任何日志进入群集：

但是我的“最小”的FreeStorageSpace图已达到零！

这是怎么回事

我对此也感到困惑。 最小均值表示单个数据节点上的大小-空闲空间最少的节点。 总和表示整个群集的大小（所有数据节点上的可用空间的总和）。 通过以下链接获得了此信息

我们遇到了同样的困惑。 平均，最小值，最大值将计算结果分布在所有节点上，总和将整个集群的可用/已用空间合并在一起。

我们假设平均FreeStorageSpace意味着整个集群的平均可用存储空间，并设置了一个警报，牢记以下计算：

因此，我们在任何时间点的平均利用率均为10 TB。 假设，按照https://docs.aws.amazon.com/elasticsearch-service/latest/developerguide/sizing-domains.html#aes-bp-storage进行复制，我们将实际存储量提高2倍，即20 TB 2的系数是：

（20 * 2 * 1.1 / 0.95 / 0.8）= 57.89 =〜60 TB

因此，我们将18 X 3.8 TB实例=〜68 TB调配为2x = 60 TB

因此，我们设置了一个警报，即如果我们将可用存储空间降至8 TB以下-这意味着我们已达到2倍的限制并应扩大规模。 因此，我们设置了警报

FreeStorageSpace <= 8388608.00在5分钟内获得4个数据点+统计=平均+持续时间= 1分钟

FreeStorageSpace的大小为MB，因此-8 TB = 8388608 MB。

但是我们立即收到警报，因为我们每个节点的平均利用率低于8 TB。

意识到要获得准确的存储后，您需要做FreeStorageSpace sum 1分钟-我们将警报设置为

FreeStorageSpace <= 8388608.00在5分钟内获得4个数据点+统计=总和+持续时间= 1分钟

以上计算已签出，我们可以设置正确的警报。

ClusterUsedSpace计算也是如此。

您还应该使用Cloudwatch Math跟踪实际可用空间百分比：