繁体 English 中英

如何获得一堆短暂的Kubernetes职位的指标

[英]How to get metrics of bunches of short-lived Kubernetes jobs

原文 2019-07-19 09:43:27 2 1 kubernetes/ kubelet/ cadvisor

我有一个情况是，将根据用户请求创建短暂的（从几秒钟到1-2分钟）k8s作业。 我正在尝试检索作业运行时指标（如cpu和内存使用情况）。

我想到（并尝试过）的方法包括：

普罗米修斯查询，例如container_cpu_usage_seconds_total ，但基于拉的scape表示将不包含许多短期作业
Pushgateway，但是正如普罗米修斯所建议的， ... Pushgateway的有效用例是用于捕获服务级批处理作业的结果，因此我怀疑这不是合适的情况。
公制服务器，但公制服务器仅在短暂的作业容器上返回404，导致结果比普罗米修斯更糟。
直接查询/api/v1/nodes/{nodeName}/proxy/metrics/cadvisor 。 尽管几乎是实时的，但它会返回所有容器，因此我必须手动解析结果并找到所需的内容。

我正在考虑使用作业工人容器旁边的轻型监视器容器来检索工人的指标。 但是我不知道这是否是一个好主意，即使这样，也不知道如何检索工人的指标。

所以我的问题是：

您建议使用哪种方法来检索大量短期作业的cpu和内存使用情况？

1 个解决方案

在编写时，您使用了普罗米修斯，pushgateway，metrics-server ns查询/ api / v1 / nodes / {nodeName} / proxy / metrics / cadvisor，如果它们不能满足您的要求，我建议您使用新的方法来监视和保存集群表现是石蕊。

Prometheus是最常见，最复杂的工具，大多数工程师都可以使用，但是Litmus是一种新工具，专注于工作负载测试，可以保存指标并可以随时存储它们。

您可以在这里找到更多信息： litmus 。

有用的文章： litmus-openebs ，它描述的不仅是获取内存使用率，也不是获取指标。

然后，您可以在鸡蛋中生成图表。 gnuplot。

如何使用Kubernetes处理周期性的短期任务

[英]How to handle recurring short-lived tasks with Kubernetes

Prometheus + Kubernetes - 即使短命，所有 pod 都会获得价值吗？

[英]Prometheus + Kubernetes - do all pods get values even if short lived?

Loki 不收集短寿命 pod 的日志

[英]Loki doesn't collect logs of short-lived pods

容器中的短暂kubernetes容器（/ sidekick）（在复制控制器中）

[英]Short lived kubernetes container (/sidekick) in a pod (in a Replication Controller)

Kubernetes：如何获取节点的磁盘/ CPU指标

[英]Kubernetes: How to get disk / cpu metrics of a node

如何在 Anthos Metrics for Kubernetes 集群中获取数据

[英]How to get data in Anthos Metrics for Kubernetes clusters

"如何使用 nodejs 获取 kubernetes pod 指标"

[英]How to get kubernetes pod metrics with nodejs

kubernetes“无法获取指标”

[英]kubernetes "unable to get metrics"

即使 Kubernetes pod 被杀死，如何保持长期连接？

[英]How to keep long lived connection alive even when the Kubernetes pod get killed?

如何连接 kubernetes 作业？

[英]How to concatenate kubernetes jobs?

暂无

暂无

声明:本站的技术帖子网页，遵循CC BY-SA 4.0协议，如果您需要转载，请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

相关问题 如何使用Kubernetes处理周期性的短期任务 Prometheus + Kubernetes - 即使短命，所有 pod 都会获得价值吗？ Loki 不收集短寿命 pod 的日志容器中的短暂kubernetes容器（/ sidekick）（在复制控制器中） Kubernetes：如何获取节点的磁盘/ CPU指标如何在 Anthos Metrics for Kubernetes 集群中获取数据 "如何使用 nodejs 获取 kubernetes pod 指标" kubernetes“无法获取指标” 即使 Kubernetes pod 被杀死，如何保持长期连接？如何连接 kubernetes 作业？

相关标签

粤ICP备18138465号 © 2020-2024 STACKOOM.COM