繁体   English   中英

指标每分钟递增的 Prometheus 警报规则

[英]Prometheus alert rule for metric incrementing every minute

我有一个跟踪错误计数的指标。 我想要有一个规则,其中当错误计数增加并且在过去 5 分钟内每分钟 > 100 时会发出警报。

 rules:
      - alert: Error count greater than threshold     
        expr: error_count > 100
        for: 5m

上面的警报只是检查错误计数是否 > 100 持续 5 分钟,但我想检查错误计数是否每分钟增加 100。 这样可以查吗?

如果你想在最后一分钟看到 5,你必须像这样在 5 分钟内使用平均值

avg_over_time(error_count[5m])

如果你想在警报响应(集成)中看到你的价值,你必须像这样将价值添加到标签中

        expr: error_count > 100
        for: 5m
        labels:
          severity : critical
          value : "{{ $value }}"

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM