标签[kube-state-metrics] - 堆栈内存溢出

kube-system（kube-controller 和 kube-flannels）pod 使用了太多资源 - kube-system (kube-controller and kube-flannels) pods are using too much resources

所以我将 eks amazon 托管集群用于 Kubernetes，我注意到一些 pod 使用了太多资源，memory 和 cpu。 pod 是 kube-controller 和 kube-flannels 当前版本的 Kubernetes 是 1.22（从问题的 1.21 bc 升级）我的 ...

kube-state-metrics 不使用服务监视器发送指标 - kube-state-metrics not sending metrics using service monitor

我已经将 kube-state-metrics 部署到 kube-system 命名空间中，并且在同一个集群中，我们正在运行 prometheus-operator 我已经编写了以下服务监视器文件，用于将指标发送到 prometheus，但它不起作用。请在下面找到文件。服务监视器.yaml ...

有没有办法找出哪个容器错过了特定的指标 - Is there a way to find out which container miss the specific metric

我正在尝试查找集群中没有任何资源规范的所有容器并为此发出警报。现在我正在考虑在kube_pod_container_info查询中使用所有container和pod label 并对kube_pod_container_resource_requests进行absent查询，但不知道如何实现。 ...

使用 prometheus-community helm chart 如何公开自定义 pod 标签 - Using prometheus-community helm chart how can I expose custom pod labels

我已将默认图表（ helm install test prometheus-community/prometheus ）部署到我的 minikube（Kubernetes 版本 1.21.5）。我想将自定义 pod 标签附加到来自kube_pod_status_ready kube-state- ...

删除或重命名 scrape_config label - Drop or rename scrape_config label

我想从我的指标中的/metrics端点重命名或删除 label。指标本身来自kube-state-metrics应用程序，所以没什么特别的。指标如下所示：我想替换的 label 是instance ，因为它指的是运行kube-state-metrics应用程序的主机，我不关心它。我想在in ...

如何获得 pod 状态的正确指标？ - How can I get correct metric for pod status?

我正在尝试通过 GKE 集群中的 Prometheus 获取 Grafana 中的 pod 状态。 kube-state-metrics已通过使用prometheus-community/prometheus和grafana Helm 图表与 Prometheus 一起安装。我试图通过kube ...

为 kube-controller-manager 和 kube-scheduler 启用端点 - Enable endpoints for kube-controller-manager & kube-scheduler

我是 kubernetes 世界的新手，目前我正忙于弄清楚如何为kube-controller-manager和kube-scheduler启用端点。将来，我将使用 helm kube-prometheus-stack来抓取这些端点以获取指标。但是，目前设置这些端点的正确方法是什么？ ...

Prometheus 指标与 kubernetes 仪表板中的 kubestate 指标不匹配 - Prometheus metrics are not matching with kubestate metrics in kubernetes dashboard

Kubernetes 仪表板中的指标： kubectl 顶级报告： Prometheus Grafana 仪表板中的指标：我使用 helm chart prometheus-community/kube-prometheus-stack 安装了 Prometheus 操作员设置。谁能 ...

在 prometheus-operator 中扩展 kube-state-metrics - Scaling kube-state-metrics in prometheus-operator

在 Prometheus-operator 中，我想将kube-state-metrics副本增加到 2。如果我增加副本，并且由于默认服务发现角色是endpoints ，Prometheus 将抓取每个 pod，因此我会将所有指标抓取两次会导致多对多问题，这是一种浪费。我遇到的问题是一个节点出现 ...

Helm 无法找到本地图表来更新依赖项 - Helm not able finding local charts to update the dependency

我正在使用 helm 3 在我的 vanilla k8s 集群上安装 Prometheus。 Prometheus 带有 kube-state-metrics 图表依赖项。我的机器完全无法上网，所以我所有的开发都是本地的。我已经安装了图表博物馆，它确实有我的回购。但是当我尝试更新依赖项时，它无 ...

当 k8s 集群中的特定 pod 进入 Failed state 时，如何配置警报？ - how to configure an alert when a specific pod in k8s cluster goes into Failed state?

我们在spark-operator的帮助下在 k8s 集群上运行 spark。我们使用prometheus进行监控。我们想要配置一个警报，以便每当与 spark 作业相关的任何 pod 转换为Failed state 时，我们都应该收到警报。并且此警报规则应在过去 5 分钟内检查此类失败的 ...

无法了解 Stackdriver Monitoring 使用情况的 GCP 帐单 - Unable to understand GCP bill for Stackdriver Monitoring usage

我们已经在 GCP 上的 kubernetes 集群之一上实现了 kube-state 指标（按照本文第4.4.1 节中提到的步骤安装监控组件）。所以基本上它在我们的集群上创建了 3 个新的部署 node-exporter、prometheus-k8s 和 kube-state 指标。之后，我们 ...

将 YAML 转换为 JSON 时出错：yaml：第 21 行：找到违反缩进的制表符 - error converting YAML to JSON: yaml: line 21: found a tab character that violate indentation

以下 deployment.yaml 出现错误： admin@ip-172-20-58-79:~/kubernetes-prometheus/kube-state-metrics-configs$ kubectl apply -f deployment.yaml admin@ip-172- ...

kube-state-metrics 的错误“没有与所有谓词匹配的节点：MatchNodeSelector (7), PodToleratesNodeTaints (1)” - error "No nodes are available that match all of the predicates: MatchNodeSelector (7), PodToleratesNodeTaints (1)" for kube-state-metrics

对于 kube-state-metrics，我收到错误“没有与所有谓词匹配的节点可用：MatchNodeSelector (7), PodToleratesNodeTaints (1)”。请指导我如何解决此问题 admin@ip-172-20-58-79:~/kubernetes-prometh ...

从系列结果 PromQL 中省略标签 - Omit labels from series results PromQL

假设我写了一个这样的基本 PromQL 查询查询： kube_deployment_spec_replicas{} 结果： kube_deployment_spec_replicas{deployment="mydeployment",endpoint="myendpoint",instance=" ...

一旦最近的作业通过，如何清理失败的 CronJob 生成的作业 - How to cleanup failed CronJob spawned Jobs once a more recent job passes

我正在使用 Kubernetes CronJobs 运行管理任务，并让 Prometheus 在使用kube-state-metrics生成的作业之一失败时发出警报：我想拥有它，以便当最近的作业通过时，清理失败的作业，以便警报停止触发。 CronJob 资源本身是否支持这种行为？解决方法是让作 ...

Kube-state-metrics 是新的还是格式良好的指标？ - Are Kube-state-metrics new or well formatted metrics?

我对 Kubernetes 还很陌生，并且对 kube-state-metrics 有疑问。当我使用 Prometheus 简单地监控 Kubernetes 时，我从 cAdvisor、节点（节点导出器）、pod 等获得了一组指标。当我包含 kube-state-metrics 时，我似乎获得了 ...

PromQL 绘制每小时创建的 Kube.netes POD 数量 - PromQL to graph number of Kubernetes PODs created per Hour

我将 Kube.netes 与 kube-state-metrics 和 Prometheus/grafana 结合使用来绘制 Kube.netes 集群的各种指标。现在我想用图表表示随着时间的推移每小时创建了多少个新的POD。指标kube_pod_created包含创建时间戳作为值，但由于每个 ...

如何为外部Prometheus服务器安装和配置kube-state-metrics以监视kubernetes - How to install and configure kube-state-metrics for external prometheus serverto monitor kubernetes

如何安装和配置kube-state-metrics以监视外部/单独/集中式Prometheus服务器上的kubernetes。我遇到了一些文章，这些文章指出了kube-state-metrics，但不确定在哪里运行kube-state-metrics 我有2个kubernetes集 ...

kubernetes_sd_config（在prometheus 内）与metrics-server 和kube-state-metrics 有什么区别？ - What is the difference among kubernetes_sd_config (within prometheus) and metrics-server and kube-state-metrics?

我阅读了一些关于监控 k8s 的页面，我发现kubernetes_sd_config （在 prometheus 中）、 metrics-server （取代了heapster ）和kube-state-metrics 。它们都可以提供指标，但有什么区别？ kubernetes_sd_co ...