繁体   English   中英

Kubernetes Pod正常运行时间监控

[英]Kubernetes Pod Uptime Monitoring

我有一个要求,涉及将Kubernetes集群中某些Pod的正常运行时间指标汇总在一起。

我正在考虑使用Kubernetes的准备情况检查,并且好奇是否有人做了类似的事情?

基本上,我试图生成报告说该Pod在过去一周/一个月的正常运行时间为95%。

我建议您检查一下Prometheus,它是监视Kubernetes群集的内部服务,资源使用情况(在主机级别以及Kubernetes API级别)以及您的应用程序中最强大的方法。

注意:对于Pod正常运行时间,您可以使用通用的up指标。

最好是使用可以存储正常运行时间指标的时间序列数据库。 您可以使用grafana,如果需要,它可以作为头等公民随k8s集群推出。

我们使用Wavefront来存储和可视化此正常运行时间指标以及大量其他指标。 一旦有了可用的正常运行时间值,您就会看到容器容器停机期间突然下降,prometheus / wavefront / grafan全部可以让您应用时间序列函数来查看(在特定时间段内的总正常运行时间/总的容器停机时间)(以您的情况为准)以反映您的需求

稍加思考,我们就确定了这种可能的方法:

  1. 部署一个定期执行BASH脚本的Docker容器(Cron)
  2. BASH脚本使用Kubernetes API Server发现需要检查的Pod
  3. BASH脚本生成一个报告,该报告将复制到主机上的安装目录
  4. 然后可以由另一个应用程序提取此报告并进行处理

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM