标签[prometheus] - 堆栈内存溢出

对时间序列进行分组时保留缺失的 label 值 - Preserve absent label values when grouping time series

假设我有两个指标： metric1具有以下系列和metric2具有以下系列：如果我运行查询sum(metric1) by(a) + on(a) sum(metric2) by (a) ，那么它只返回{a='1'} 22 ，但我想保留带有{a='2'}并向其添加 0。这有可能吗？ ...

Prometheus 在不使用组语句的情况下在加入请求中添加额外的 label？ - Prometheus add extra label on join request without using group statement?

我正在与普罗米修斯合作。我有以下指标：指标 1 指标 2 所以这两个指标都有命名空间和 instance_id label，然后它们有额外的标签（label2、3、4）。我正在通过以下请求对他们进行加入请求：现在，这是 1:1 连接，在特定时间，我不应该有两个具有相同 instance_i ...

将在负载均衡器后面运行的 ec2 实例注册为普罗米修斯中的目标时出现的问题 - Problems in registering ec2 instances running behind a load balancer as targets in prometheus

我的设置我在机器上设置了 prometheus 和 grafana - M1 我有一个 AWS 负载均衡器 (LB1)，它将请求转发到应用程序实例并处理 ssl 部分。负载均衡器有一个侦听器侦听 https:443 并将请求转发到具有 2 个 EC2 实例（I1、I2）的目标组 (TG1)。每个 ...

如何将监控限制在普罗米修斯中的单个命名空间。我无法获得任何命名空间选项来设置单个命名空间 - How monitoring can be limited to single namespace in prometheus. I am unable to get any namespaces options to set a single namespace

我使用了链接“https://raw.githubusercontent.com/istio/istio/release-1.16/samples/addons/prometheus.yaml”中的 prometheus 部署。我们希望 prometheus 监控单个命名空间，这将帮助我们在单个命 ...

普罗米修斯使用自定义脚本发现动态目标 - prometheus discovery of dynamic targets with custom script

我使用 prometheus 来监控在动态端口上公开指标的服务，每次重启时端口都会发生变化。我创建了检查服务端点端口的脚本，我如何将新的目标端点端口发送到普罗米修斯？你能给我举个例子吗？ ...

kube-api 服务器高 cpu - kube-api server high cpu

这个问题是从 Stack Overflow 迁移过来的，因为它可以在 Server Fault 上回答。 3 天前迁移。我想知道如何检查为什么我的 ctrl 节点和 kube.netes 中的一个比其他节点消耗更多的 cpu。我有一个包含 3 个控制节点和 4 个工作节点的集群。我有一个 ...

Prometheus 未能获取服务发现可以找到的指标 - Prometheus failing to pick up metrics that service discovery can find

我正在尝试使用 Prometheus Istiod 指标进行抓取，但到目前为止可以在未定义的服务中看到这个端点，不确定那是什么。服务定义： ServiceMonitor的定义：这就是它在 Prometheus 中的服务发现中的样子：我希望看到这个端点在普罗米修斯中被正确废弃。 ...

单个 pod 处于 ContainerCreating Phase，其他 pod 处于 Running Phase - A single pod is in ContainerCreating Phase and others are in Running Phase

如果单个 pod 处于 ContainerCreating 阶段而其他 pod 处于特定服务的运行阶段，这意味着什么？我的服务是否中断或有什么我需要担心的？没找到靠谱的 ...

比较最后两个连续 5 分钟间隔的指标计数器值 (prometheus ql) - Compare metrics counter value for the last two successive 5 min intervals (prometheus ql)

我有一个计数器，每次某些服务器逻辑成功时它都会增长。我正在尝试编写一个表达式，以百分比计算最后 5 分钟和前 5 分钟间隔之间的计数器值差异。如果差异超过 50%，我应该提醒。所以我想我需要评估每个 5 分钟间隔的值，然后比较它们中的两个连续值。到目前为止，我正在尝试使用此查询：但我想这 ...

Prometheus Alertmanager API 管理沉默 - Prometheus Alertmanager API to manage silences

如果可能的话，我想使用 curl 调用通过 API 创建和删除静音。我可以通过使用这种调用来创建静音： }' 但我不知道如何调用删除它。在调用中使用 -XDELETE，返回“方法无效”。 ...

是否有 Prometheus 请求的语法可以避免在选择器中重复相同的标签？ - Is there a syntax of Prometheus request that avoid repeating of the same labels in the selectors?

我使用 Prometheus+Grafana 并编写如下公式：坦率地说，我厌倦了在选择器中重复相同（大部分相同）的标签。如果我能写出类似这样的东西那就太好了：我阅读了 Prometheus 手册，但没有意识到是否有一种语法可以使我的公式不那么冗长？ ...

如何使用Prometheus PromQL查询当天0:00的metric值 - How query metric value at 0:00 of the day by using Prometheus PromQL

prometheus在当天0:00获取metric值例如：metric名称是eseal_num_total，为什么写成'eseal_num_total @ (time()-(time()+28800)%86400)'然后执行Promql 'eseal_num_total @(time ()-(t ...

Prometheus 不在“/metrics”端点上显示来自本地主机服务的自定义指标 - Prometheus not displaying custom metrics from localhost service on `/metrics` endpoint

我在本地主机上运行一项服务，该服务将指标导出到在 Docker 上运行的 Prometheus 容器。我能够看到我的指标已通过 Prometheus 的 /graph 端点正确注册、抓取和显示。但是，我找不到在 Prometheus 的 /metrics 端点上报告的指标。我的服务使用 Prom ...

count_over_time 按天计算的总和 - sum of count_over_time by day

我在 Grafana 中有以下 Loki 查询：这使但我不知所措，试图按天对总和进行分组。我尝试了sum by (grouping) (expr)的各种版本，但通常以解析错误告终。这些文档似乎不是很“包罗万象”。我想要一个显示每天总和或错误的表格（在给定窗口中）。 ...

如何向我的 Grafana 链接添加条件？ - How do I add a condition to my Grafana link?

在我的 Grafana 仪表板（使用 Prometheus 作为数据源）中，我有一个自定义的 $site 变量，它允许用户从下拉列表中选择站点。它被定义为：选中“包括所有选项”。然后我有一个指向我的 Kibana 仪表板的链接，我在其中使用此变量传递所选站点，如下所示： When eith ...

如何使用kafka连接到普罗米修斯中的TSDB数据库显示kafka主题消息 - How to display kafka topic message using kafka connect to TSDB database in Prometheus

我想监控普罗米修斯中的kafka主题消息。我将同样使用 kafka connect，但我想了解如何在 prometheus tsdb 中获取消息内容详细信息。 ...

使用 Prometheus 的“向上”指标查询 SLI - Query SLI using Prometheus's "up" metric

我想查询一个服务器的SLI（比如99.3%）。有一个up Prometheus 指标，当服务器启动时其值为1 ，当服务器关闭时为0或不存在。我已经尝试了很多查询，例如下面显示的查询，但它们没有显示平均值： ...

Azure 用于监控 VPN 隧道状态的监控指标 - Azure Monitor metrics for monitoring VPN Tunnel Status

我正在探索使用 Azure Monitor 通过 Azure Monitor metrics Exporter( https://github.com/webdevops/azure-metrics-exporter ) 监控 VPN 隧道状态。监控堆栈是 Victoria Metrics + G ...

无法在 Grafana 仪表板上看到节点的数据 - Unable to see nodes' data on Grafana dashboard

我在我的 Ubuntu 上安装了 Prometheus 和 Grafana。我添加了节点导出器来抓取指标。在 Grafana 中，我添加了 Prometheus 作为我的数据源。它已成功添加。但是，当我导入 Node Exporter Dashboard 时，我没有获得任何数据。可能是什么问 ...

Cloudwatch 代理报废普罗米修斯指标 - Cloudwatch agent scrap prometheus metrics

我在 EKS 中运行的 kube.netes 上运行 pod。我在集群上安装了 Prometheus。我希望将一些来自 Prometheus 的指标导出到 Cloudwatch 指标。所以我遵循这个指南。当需要修改我的 cwagent 配置时，我在当前配置中有这个：因为我仍然希望基本的 k ...