繁体   English   中英

普罗米修斯在缺席的情况下使用avg_over_time

[英]Prometheus use of avg_over_time with absent

我们已经开始使用Prometheus来监控我们的基础架构。 一种服务已配置了以下警报:

  • (不存在(up {job =“ service”}}或(up {job =“ service”} == 0)+1)== 1

这样,如果“ up”为零或没有度量标准,我们将收到警报。

现在,我们需要一个显示服务的“正常运行时间”的grafana“单一状态”面板,但是“ avg_over_time”不能与“缺少”一起使用,是否可以在正常运行时间的面板中包含类似“不存在”的选项?

您可以通过类似以下内容来近似:

sum_over_time(up{job="service"}[24h]) / sum_over_time(up{job="prometheus"}[24h])

这会将记录您的服务为“运行中”(过去24小时)的样本数除以记录普罗米修斯为“运行中”的样本数。

否则,您可以使用一条记录规则来记录类似于警报条件的内容,如果您的服务已启动,则该值为1,否则为0。 然后,您可以在该指标上使用avg_over_time()

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM