[英]How to make avg_over_time with variable interval in prometheus request?
[英]Prometheus use of avg_over_time with absent
我们已经开始使用Prometheus来监控我们的基础架构。 一种服务已配置了以下警报:
这样,如果“ up”为零或没有度量标准,我们将收到警报。
现在,我们需要一个显示服务的“正常运行时间”的grafana“单一状态”面板,但是“ avg_over_time”不能与“缺少”一起使用,是否可以在正常运行时间的面板中包含类似“不存在”的选项?
您可以通过类似以下内容来近似:
sum_over_time(up{job="service"}[24h]) / sum_over_time(up{job="prometheus"}[24h])
这会将记录您的服务为“运行中”(过去24小时)的样本数除以记录普罗米修斯为“运行中”的样本数。
否则,您可以使用一条记录规则来记录类似于警报条件的内容,如果您的服务已启动,则该值为1,否则为0。 然后,您可以在该指标上使用avg_over_time()
。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.