所以我将 eks amazon 托管集群用于 Kubernetes,我注意到一些 pod 使用了太多资源,memory 和 cpu。 pod 是 kube-controller 和 kube-flannels 当前版本的 Kubernetes 是 1.22(从问题的 1.21 bc 升级) 我的 ...
所以我将 eks amazon 托管集群用于 Kubernetes,我注意到一些 pod 使用了太多资源,memory 和 cpu。 pod 是 kube-controller 和 kube-flannels 当前版本的 Kubernetes 是 1.22(从问题的 1.21 bc 升级) 我的 ...
我已经将 kube-state-metrics 部署到 kube-system 命名空间中,并且在同一个集群中,我们正在运行 prometheus-operator 我已经编写了以下服务监视器文件,用于将指标发送到 prometheus,但它不起作用。 请在下面找到文件。 服务监视器.yaml ...
我正在尝试查找集群中没有任何资源规范的所有容器并为此发出警报。 现在我正在考虑在kube_pod_container_info查询中使用所有container和pod label 并对kube_pod_container_resource_requests进行absent查询,但不知道如何实现。 ...
我已将默认图表( helm install test prometheus-community/prometheus )部署到我的 minikube(Kubernetes 版本 1.21.5)。 我想将自定义 pod 标签附加到来自kube_pod_status_ready kube-state- ...
我想从我的指标中的/metrics端点重命名或删除 label。 指标本身来自kube-state-metrics应用程序,所以没什么特别的。 指标如下所示: 我想替换的 label 是instance ,因为它指的是运行kube-state-metrics应用程序的主机,我不关心它。 我想在in ...
我正在尝试通过 GKE 集群中的 Prometheus 获取 Grafana 中的 pod 状态。 kube-state-metrics已通过使用prometheus-community/prometheus和grafana Helm 图表与 Prometheus 一起安装。 我试图通过kube ...
我是 kubernetes 世界的新手,目前我正忙于弄清楚如何为kube-controller-manager和kube-scheduler启用端点。 将来,我将使用 helm kube-prometheus-stack来抓取这些端点以获取指标。 但是,目前设置这些端点的正确方法是什么? ...
Kubernetes 仪表板中的指标: kubectl 顶级报告: Prometheus Grafana 仪表板中的指标: 我使用 helm chart prometheus-community/kube-prometheus-stack 安装了 Prometheus 操作员设置。 谁能 ...
在 Prometheus-operator 中,我想将kube-state-metrics副本增加到 2。如果我增加副本,并且由于默认服务发现角色是endpoints ,Prometheus 将抓取每个 pod,因此我会将所有指标抓取两次会导致多对多问题,这是一种浪费。 我遇到的问题是一个节点出现 ...
我正在使用 helm 3 在我的 vanilla k8s 集群上安装 Prometheus。 Prometheus 带有 kube-state-metrics 图表依赖项。 我的机器完全无法上网,所以我所有的开发都是本地的。 我已经安装了图表博物馆,它确实有我的回购。 但是当我尝试更新依赖项时,它无 ...
我们在spark-operator的帮助下在 k8s 集群上运行 spark。 我们使用prometheus进行监控。 我们想要配置一个警报,以便每当与 spark 作业相关的任何 pod 转换为Failed state 时,我们都应该收到警报。 并且此警报规则应在过去 5 分钟内检查此类失败的 ...
我们已经在 GCP 上的 kubernetes 集群之一上实现了 kube-state 指标(按照本文第4.4.1 节中提到的步骤安装监控组件)。 所以基本上它在我们的集群上创建了 3 个新的部署 node-exporter、prometheus-k8s 和 kube-state 指标。 之后,我们 ...
以下 deployment.yaml 出现错误: admin@ip-172-20-58-79:~/kubernetes-prometheus/kube-state-metrics-configs$ kubectl apply -f deployment.yaml admin@ip-172- ...
对于 kube-state-metrics,我收到错误“没有与所有谓词匹配的节点可用:MatchNodeSelector (7), PodToleratesNodeTaints (1)”。 请指导我如何解决此问题 admin@ip-172-20-58-79:~/kubernetes-prometh ...
假设我写了一个这样的基本 PromQL 查询查询: kube_deployment_spec_replicas{} 结果: kube_deployment_spec_replicas{deployment="mydeployment",endpoint="myendpoint",instance=" ...
我正在使用 Kubernetes CronJobs 运行管理任务,并让 Prometheus 在使用kube-state-metrics生成的作业之一失败时发出警报: 我想拥有它,以便当最近的作业通过时,清理失败的作业,以便警报停止触发。 CronJob 资源本身是否支持这种行为? 解决方法是让作 ...
我对 Kubernetes 还很陌生,并且对 kube-state-metrics 有疑问。 当我使用 Prometheus 简单地监控 Kubernetes 时,我从 cAdvisor、节点(节点导出器)、pod 等获得了一组指标。当我包含 kube-state-metrics 时,我似乎获得了 ...
我将 Kube.netes 与 kube-state-metrics 和 Prometheus/grafana 结合使用来绘制 Kube.netes 集群的各种指标。 现在我想用图表表示随着时间的推移每小时创建了多少个新的POD。 指标kube_pod_created包含创建时间戳作为值,但由于每个 ...
如何安装和配置kube-state-metrics以监视外部/单独/集中式Prometheus服务器上的kubernetes。 我遇到了一些文章,这些文章指出了kube-state-metrics,但不确定在哪里运行kube-state-metrics 我有2个kubernetes集 ...
我阅读了一些关于监控 k8s 的页面,我发现kubernetes_sd_config (在 prometheus 中)、 metrics-server (取代了heapster )和kube-state-metrics 。 它们都可以提供指标,但有什么区别? kubernetes_sd_co ...