假设我有两个指标: metric1具有以下系列 和metric2具有以下系列: 如果我运行查询sum(metric1) by(a) + on(a) sum(metric2) by (a) ,那么它只返回{a='1'} 22 ,但我想保留带有{a='2'}并向其添加 0。 这有可能吗? ...
假设我有两个指标: metric1具有以下系列 和metric2具有以下系列: 如果我运行查询sum(metric1) by(a) + on(a) sum(metric2) by (a) ,那么它只返回{a='1'} 22 ,但我想保留带有{a='2'}并向其添加 0。 这有可能吗? ...
我正在与普罗米修斯合作。 我有以下指标: 指标 1 指标 2 所以这两个指标都有命名空间和 instance_id label,然后它们有额外的标签(label2、3、4)。 我正在通过以下请求对他们进行加入请求: 现在,这是 1:1 连接,在特定时间,我不应该有两个具有相同 instance_i ...
我的设置我在机器上设置了 prometheus 和 grafana - M1 我有一个 AWS 负载均衡器 (LB1),它将请求转发到应用程序实例并处理 ssl 部分。 负载均衡器有一个侦听器侦听 https:443 并将请求转发到具有 2 个 EC2 实例(I1、I2)的目标组 (TG1)。 每个 ...
我使用了链接“https://raw.githubusercontent.com/istio/istio/release-1.16/samples/addons/prometheus.yaml”中的 prometheus 部署。 我们希望 prometheus 监控单个命名空间,这将帮助我们在单个命 ...
我使用 prometheus 来监控在动态端口上公开指标的服务,每次重启时端口都会发生变化。 我创建了检查服务端点端口的脚本,我如何将新的目标端点端口发送到普罗米修斯? 你能给我举个例子吗? ...
这个问题是从 Stack Overflow 迁移过来的,因为它可以在 Server Fault 上回答。 3 天前迁移。 我想知道如何检查为什么我的 ctrl 节点和 kube.netes 中的一个比其他节点消耗更多的 cpu。 我有一个包含 3 个控制节点和 4 个工作节点的集群。 我有一个 ...
我正在尝试使用 Prometheus Istiod 指标进行抓取,但到目前为止可以在未定义的服务中看到这个端点,不确定那是什么。 服务定义: ServiceMonitor的定义: 这就是它在 Prometheus 中的服务发现中的样子: 我希望看到这个端点在普罗米修斯中被正确废弃。 ...
如果单个 pod 处于 ContainerCreating 阶段而其他 pod 处于特定服务的运行阶段,这意味着什么? 我的服务是否中断或有什么我需要担心的? 没找到靠谱的 ...
我有一个计数器,每次某些服务器逻辑成功时它都会增长。 我正在尝试编写一个表达式,以百分比计算最后 5 分钟和前 5 分钟间隔之间的计数器值差异。 如果差异超过 50%,我应该提醒。 所以我想我需要评估每个 5 分钟间隔的值,然后比较它们中的两个连续值。 到目前为止,我正在尝试使用此查询: 但我想这 ...
如果可能的话,我想使用 curl 调用通过 API 创建和删除静音。 我可以通过使用这种调用来创建静音: }' 但我不知道如何调用删除它。 在调用中使用 -XDELETE,返回“方法无效”。 ...
我使用 Prometheus+Grafana 并编写如下公式: 坦率地说,我厌倦了在选择器中重复相同(大部分相同)的标签。 如果我能写出类似这样的东西那就太好了: 我阅读了 Prometheus 手册,但没有意识到是否有一种语法可以使我的公式不那么冗长? ...
prometheus在当天0:00获取metric值 例如:metric名称是eseal_num_total,为什么写成'eseal_num_total @ (time()-(time()+28800)%86400)'然后执行Promql 'eseal_num_total @(time ()-(t ...
我在本地主机上运行一项服务,该服务将指标导出到在 Docker 上运行的 Prometheus 容器。我能够看到我的指标已通过 Prometheus 的 /graph 端点正确注册、抓取和显示。 但是,我找不到在 Prometheus 的 /metrics 端点上报告的指标。 我的服务使用 Prom ...
我在 Grafana 中有以下 Loki 查询: 这使 但我不知所措,试图按天对总和进行分组。 我尝试了sum by (grouping) (expr)的各种版本,但通常以解析错误告终。 这些文档似乎不是很“包罗万象”。 我想要一个显示每天总和或错误的表格(在给定窗口中)。 ...
在我的 Grafana 仪表板(使用 Prometheus 作为数据源)中,我有一个自定义的 $site 变量,它允许用户从下拉列表中选择站点。 它被定义为: 选中“包括所有选项”。 然后我有一个指向我的 Kibana 仪表板的链接,我在其中使用此变量传递所选站点,如下所示: When eith ...
我想监控普罗米修斯中的kafka主题消息。 我将同样使用 kafka connect,但我想了解如何在 prometheus tsdb 中获取消息内容详细信息。 ...
我想查询一个服务器的SLI(比如99.3%)。 有一个up Prometheus 指标,当服务器启动时其值为1 ,当服务器关闭时为0或不存在。 我已经尝试了很多查询,例如下面显示的查询,但它们没有显示平均值: ...
我正在探索使用 Azure Monitor 通过 Azure Monitor metrics Exporter( https://github.com/webdevops/azure-metrics-exporter ) 监控 VPN 隧道状态。 监控堆栈是 Victoria Metrics + G ...
我在我的 Ubuntu 上安装了 Prometheus 和 Grafana。我添加了节点导出器来抓取指标。 在 Grafana 中,我添加了 Prometheus 作为我的数据源。 它已成功添加。 但是,当我导入 Node Exporter Dashboard 时,我没有获得任何数据。 可能是什么问 ...
我在 EKS 中运行的 kube.netes 上运行 pod。 我在集群上安装了 Prometheus。 我希望将一些来自 Prometheus 的指标导出到 Cloudwatch 指标。 所以我遵循这个指南。 当需要修改我的 cwagent 配置时,我在当前配置中有这个: 因为我仍然希望基本的 k ...