繁体   English   中英

使用Grafana监控Kubernetes:使用最新的Prometheus版本丢失大量数据

[英]Monitoring Kubernetes with Grafana: lots of missing data with latest Prometheus version

我有一个工作Kubernetes集群,我想用Grafana监控。

我一直在试用https://grafana.com/dashboards中的许多仪表板,但它们似乎都有一些问题:看起来Prometheus度量标准名称和仪表板预期之间存在不匹配。

例如,如果我看一下最近发布的,非常受欢迎的仪表板: https//grafana.com/dashboards/5309/revisions

运行时我最终会遇到很多“漏洞”:

具有缺失值的grafana仪表板

查看面板配置,我发现问题来自小的密钥更改,例如node_memory_Buffers而不是node_memory_Buffers_bytes

同样的仪表盘预计node_disk_bytes_written当普罗米修斯提供node_disk_written_bytes_total

我已经尝试了很多特定于Kubernetes的仪表板,我几乎都遇到了同样的问题。

难道我做错了什么?

Prometheus节点导出器更改了0.16.0版本中的许多度量标准名称,以符合新的命名约定。

来自https://github.com/prometheus/node_exporter/releases/tag/v0.16.0

打破变化

此版本包含对度量标准名称的重大更改。 许多度量标准都具有新名称,标签和标签值,以符合当前的命名约定。

  • Linux node_cpu指标现在将guest值分解为单独的指标。
  • 许多计数器指标已重命名为include _total
  • 许多度量标准已重命名/修改为包含基本单位,例如node_cpu现在为node_cpu_seconds_total

另请参阅升级指南 其中一个建议是使用兼容性规则 ,这些规则将使用旧名称创建重复的度量标准。

否则,在仪表板更新之前使用版本0.15.x,或者修复它们!

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM