[英]Kubernetes Pod Uptime Monitoring
我有一个要求,涉及将Kubernetes集群中某些Pod的正常运行时间指标汇总在一起。
我正在考虑使用Kubernetes的准备情况检查,并且好奇是否有人做了类似的事情?
基本上,我试图生成报告说该Pod在过去一周/一个月的正常运行时间为95%。
我建议您检查一下Prometheus,它是监视Kubernetes群集的内部服务,资源使用情况(在主机级别以及Kubernetes API级别)以及您的应用程序中最强大的方法。
注意:对于Pod正常运行时间,您可以使用通用的up
指标。
最好是使用可以存储正常运行时间指标的时间序列数据库。 您可以使用grafana,如果需要,它可以作为头等公民随k8s集群推出。
我们使用Wavefront来存储和可视化此正常运行时间指标以及大量其他指标。 一旦有了可用的正常运行时间值,您就会看到容器容器停机期间突然下降,prometheus / wavefront / grafan全部可以让您应用时间序列函数来查看(在特定时间段内的总正常运行时间/总的容器停机时间)(以您的情况为准)以反映您的需求
稍加思考,我们就确定了这种可能的方法:
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.