繁体   English   中英

普罗米修斯警报管理器 - CPU 高不警报

[英]Prometheus Alert Manager - CPU high not alerting

我配置了 prometheus 警报管理器,但是当我的一台服务器的 CPU 使用率达到 99% 时,他不会发出警报。 这是警报:

- alert: HostHighCpuLoad
  expr: avg(irate(node_cpu_seconds_total{mode="idle"}[1m]) * 100) < 30
  for: 1m
  labels:
    severity: warning
  annotations:
    summary: "High usage on {{ $labels.instance }}"
    description: "{{ $labels.instance }} has a average CPU idle (current value: {{ $value }}s)"

看起来像我的表达,取我所有服务器的全局平均值,但我需要监控每台服务器的这个度量。

有人已经遇到这个问题了吗?

是的,它正在考虑所有实例的平均值。 将表达式更改为:

avg by (instance) (irate(node_cpu_seconds_total{mode="idle"}[1m]) * 100) < 30

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM