[英]Kubernetes prometheus metrics for running pods and nodes?
我通過遵循prometheus 文檔設置prometheus來監控kubernetes指標。
許多有用的指標現在都出現在prometheus中。
但是,我看不到任何引用我的pod或節點狀態的指標。
理想情況下 - 我希望能夠繪制pod狀態(Running,Pending,CrashLoopBackOff,Error)和節點(NodeReady,Ready)。
這個指標在哪里? 如果沒有,我可以將它添加到某個地方嗎? 如何?
常規kubernetes設置不會公開這些指標 - 這里進一步討論。
但是,可以使用其他服務來收集這些群集級別度量標准: https : //github.com/kubernetes/kube-state-metrics 。
這當前提供了node_status_ready和pod_container_restarts,聽起來像我想要的。
我不認為這些指標存在。
您必須修改源代碼才能添加它們。 看看這個文件如何注冊一個指標: https : //github.com/kubernetes/kubernetes/blob/master/pkg/kubelet/metrics/metrics.go ,並看看這一行如何記錄指標: https : //github.com/kubernetes/kubernetes/blob/master/pkg/kubelet/pleg/generic.go#L180
我發現我可以使用heapster&snap來監控這些指標,這對我的案例來說是一個看似合理的解決方法。 如果您正在使用這些內容,請告訴我,我會為您提供獲取此數據的正確指標。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.