繁体   English   中英

用于运行pod和节点的Kubernetes prometheus指标?

[英]Kubernetes prometheus metrics for running pods and nodes?

我通过遵循prometheus 文档设置prometheus来监控kubernetes指标。

许多有用的指标现在都出现在prometheus中。

但是,我看不到任何引用我的pod或节点状态的指标。

理想情况下 - 我希望能够绘制pod状态(Running,Pending,CrashLoopBackOff,Error)和节点(NodeReady,Ready)。

这个指标在哪里? 如果没有,我可以将它添加到某个地方吗? 如何?

常规kubernetes设置不会公开这些指标 - 这里进一步讨论。

但是,可以使用其他服务来收集这些群集级别度量标准: https//github.com/kubernetes/kube-state-metrics

这当前提供了node_status_ready和pod_container_restarts,听起来像我想要的。

我不认为这些指标存在。

您必须修改源代码才能添加它们。 看看这个文件如何注册一个指标: https//github.com/kubernetes/kubernetes/blob/master/pkg/kubelet/metrics/metrics.go ,并看看这一行如何记录指标: https//github.com/kubernetes/kubernetes/blob/master/pkg/kubelet/pleg/generic.go#L180

我发现我可以使用heapster&snap来监控这些指标,这对我的案例来说是一个看似合理的解决方法。 如果您正在使用这些内容,请告诉我,我会为您提供获取此数据的正确指标。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM