cost 85 ms
kube-system(kube-controller 和 kube-flannels)pod 使用了太多资源 - kube-system (kube-controller and kube-flannels) pods are using too much resources

所以我将 eks amazon 托管集群用于 Kubernetes,我注意到一些 pod 使用了太多资源,memory 和 cpu。 pod 是 kube-controller 和 kube-flannels 当前版本的 Kubernetes 是 1.22(从问题的 1.21 bc 升级) 我的 ...

kube-state-metrics 不使用服务监视器发送指标 - kube-state-metrics not sending metrics using service monitor

我已经将 kube-state-metrics 部署到 kube-system 命名空间中,并且在同一个集群中,我们正在运行 prometheus-operator 我已经编写了以下服务监视器文件,用于将指标发送到 prometheus,但它不起作用。 请在下面找到文件。 服务监视器.yaml ...

在 prometheus-operator 中扩展 kube-state-metrics - Scaling kube-state-metrics in prometheus-operator

在 Prometheus-operator 中,我想将kube-state-metrics副本增加到 2。如果我增加副本,并且由于默认服务发现角色是endpoints ,Prometheus 将抓取每个 pod,因此我会将所有指标抓取两次会导致多对多问题,这是一种浪费。 我遇到的问题是一个节点出现 ...

Helm 无法找到本地图表来更新依赖项 - Helm not able finding local charts to update the dependency

我正在使用 helm 3 在我的 vanilla k8s 集群上安装 Prometheus。 Prometheus 带有 kube-state-metrics 图表依赖项。 我的机器完全无法上网,所以我所有的开发都是本地的。 我已经安装了图表博物馆,它确实有我的回购。 但是当我尝试更新依赖项时,它无 ...

当 k8s 集群中的特定 pod 进入 Failed state 时,如何配置警报? - how to configure an alert when a specific pod in k8s cluster goes into Failed state?

我们在spark-operator的帮助下在 k8s 集群上运行 spark。 我们使用prometheus进行监控。 我们想要配置一个警报,以便每当与 spark 作业相关的任何 pod 转换为Failed state 时,我们都应该收到警报。 并且此警报规则应在过去 5 分钟内检查此类失败的 ...

无法了解 Stackdriver Monitoring 使用情况的 GCP 帐单 - Unable to understand GCP bill for Stackdriver Monitoring usage

我们已经在 GCP 上的 kubernetes 集群之一上实现了 kube-state 指标(按照本文第4.4.1 节中提到的步骤安装监控组件)。 所以基本上它在我们的集群上创建了 3 个新的部署 node-exporter、prometheus-k8s 和 kube-state 指标。 之后,我们 ...

kube-state-metrics 的错误“没有与所有谓词匹配的节点:MatchNodeSelector (7), PodToleratesNodeTaints (1)” - error "No nodes are available that match all of the predicates: MatchNodeSelector (7), PodToleratesNodeTaints (1)" for kube-state-metrics

对于 kube-state-metrics,我收到错误“没有与所有谓词匹配的节点可用:MatchNodeSelector (7), PodToleratesNodeTaints (1)”。 请指导我如何解决此问题 admin@ip-172-20-58-79:~/kubernetes-prometh ...

一旦最近的作业通过,如何清理失败的 CronJob 生成的作业 - How to cleanup failed CronJob spawned Jobs once a more recent job passes

我正在使用 Kubernetes CronJobs 运行管理任务,并让 Prometheus 在使用kube-state-metrics生成的作业之一失败时发出警报: 我想拥有它,以便当最近的作业通过时,清理失败的作业,以便警报停止触发。 CronJob 资源本身是否支持这种行为? 解决方法是让作 ...

如何为外部Prometheus服务器安装和配置kube-state-metrics以监视kubernetes - How to install and configure kube-state-metrics for external prometheus serverto monitor kubernetes

如何安装和配置kube-state-metrics以监视外部/单独/集中式Prometheus服务器上的kubernetes。 我遇到了一些文章,这些文章指出了kube-state-metrics,但不确定在哪里运行kube-state-metrics 我有2个kubernetes集 ...

kubernetes_sd_config(在prometheus 内)与metrics-server 和kube-state-metrics 有什么区别? - What is the difference among kubernetes_sd_config (within prometheus) and metrics-server and kube-state-metrics?

我阅读了一些关于监控 k8s 的页面,我发现kubernetes_sd_config (在 prometheus 中)、 metrics-server (取代了heapster )和kube-state-metrics 。 它们都可以提供指标,但有什么区别? kubernetes_sd_co ...


 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM