繁体   English   中英

Kubernetes / Prometheus指标不匹配

[英]Kubernetes / Prometheus Metrics Mismatch

我有一个在Kubernetes(Azure AKS)中运行的应用程序,其中每个Pod包含两个容器。 我还设置了Grafana,以显示各种度量标准,其中一些来自Prometheus。 我正在尝试对另一个问题进行故障排除,因此我注意到某些指标似乎在数据源之间不匹配。

例如, kube_deployment_status_replicas_available返回值30,而kubectl -n XXXXXXXX get pod列表(它们都正在运行),而kube_deployment_status_replicas_unavailable返回值0。而且,如果我使用kubectl获取相关的部署,我会看到期望值。

$ kubectl get deployment XXXXXXXX
NAME       DESIRED   CURRENT   UP-TO-DATE   AVAILABLE   AGE
XXXXXXXX   100       100       100          100         49d

同一集群中还有其他所有值正确关联的应用程序(命名空间),因此我不确定故障可能出在哪里,或者不确定是否有办法确定哪个值正确。 任何指导将不胜感激。 谢谢

基于具有kube_deployment_status_replicas_available指标,我假设您有Prometheus从kube-state-metrics刮取指标 听起来它的部署有些古怪。 它可能是:

我会:

  • 检查您正在运行的版本以获取kube-state-metrics,并查看它是否与您的K8s版本兼容。
  • 重新启动kube-state-metrics窗格。
  • 检查日志kubectl logs kube-state-metrics`
  • 检查Prometheus日志
    • 如果看不到任何内容,请尝试使用--log.level=debug标志启动Prometheus。

希望能帮助到你。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM