[英]Prometheus alert rule for metric incrementing every minute
我有一个跟踪错误计数的指标。 我想要有一个规则,其中当错误计数增加并且在过去 5 分钟内每分钟 > 100 时会发出警报。
rules:
- alert: Error count greater than threshold
expr: error_count > 100
for: 5m
上面的警报只是检查错误计数是否 > 100 持续 5 分钟,但我想检查错误计数是否每分钟增加 100。 这样可以查吗?
如果你想在最后一分钟看到 5,你必须像这样在 5 分钟内使用平均值
avg_over_time(error_count[5m])
如果你想在警报响应(集成)中看到你的价值,你必须像这样将价值添加到标签中
expr: error_count > 100
for: 5m
labels:
severity : critical
value : "{{ $value }}"
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.