[英]Prometheus blackbox probe helpful metrics
我有大约 1000 个使用 HTTP 探测的目标。
job="http_2xx", env="prod", instance="x.x.x.x"
job="http_2xx", env="test", instance="y.y.y.y"
job="http_2xx", env="dev", instance="z.z.z.z"
我想知道目标:
sum(increase(probe_success{job="http_2xx"}[10m]))
rate(probe_success{job="http_2xx", env="prod"}[5m]) * 100
我已经达到的最接近的是在 10 分钟内通过 env 找到操作:
avg(avg_over_time(probe_success{job="http_2xx", env="prod"}[10m]) * 100)
过去 10 分钟内 env 的失败率。 最简单的方法是:
sum(rate(probe_success{job="http_2xx"}[10m]) * 100) by (env)
这将返回您成功探测的百分比,您可以反向添加*(-1) +100
计算超过 10m 的速率和超过 10m 的速率增加似乎是多余的,在上述查询中increase
function 对我不起作用。 如果需要,您可以将速率 function 替换为increase
。
第一个查询非常接近,它将计算 10m 周期内成功探测的增加。 您可以通过添加== 0
并通过“env”变量对其求和来使其显示失败探针的增加
sum(increase(probe_success{job="http_2xx"} == 0 [10m])) by (env)
您的第二个查询将为 prod 环境返回超过 5m 的成功请求百分比
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.