我的设置我在机器上设置了 prometheus 和 grafana - M1 我有一个 AWS 负载均衡器 (LB1),它将请求转发到应用程序实例并处理 ssl 部分。 负载均衡器有一个侦听器侦听 https:443 并将请求转发到具有 2 个 EC2 实例(I1、I2)的目标组 (TG1)。 每个 ...
我的设置我在机器上设置了 prometheus 和 grafana - M1 我有一个 AWS 负载均衡器 (LB1),它将请求转发到应用程序实例并处理 ssl 部分。 负载均衡器有一个侦听器侦听 https:443 并将请求转发到具有 2 个 EC2 实例(I1、I2)的目标组 (TG1)。 每个 ...
我在我的 Ubuntu 上安装了 Prometheus 和 Grafana。我添加了节点导出器来抓取指标。 在 Grafana 中,我添加了 Prometheus 作为我的数据源。 它已成功添加。 但是,当我导入 Node Exporter Dashboard 时,我没有获得任何数据。 可能是什么问 ...
我有几台带有 windows 导出器的机器(windows7、8、10、11)(我还使用带有 .prom 文件的 textfile_inputs 文件夹来导出一些变量,以便使用 prometheus 指标查看它们)。 windows 导出器作为服务运行。 它在 windows 7,8 上的一切都 ...
我使用 prometheus 和 alertmanager 来监控几台服务器,每次服务器 go 宕机时,我都会收到一堆警报。 “Nginx 宕机”“Docker 宕机”伴随着“主机宕机”警报,这会在 pagerduty 和 email 中产生一堆垃圾邮件。我不想收到特定服务的警报,而我已经收到整 ...
我正在尝试使用 PromQL 进行查询以检查 memory 是否可用(RAM)。 下面的查询是否正确检查 memory 在没有缓存和缓冲区的情况下可用? 我将查询重新发送到链接 我之前使用过下面的查询,但结果看起来不像我要找的答案 ...
我有一个如下所示的普罗米修斯查询。 截屏(100 * avg by (instance) (rate(node_cpu_seconds_total{mode!="idle"}[1m]))) 它通过 GUI 给出一个实例的汇总 CPU 使用率您可以在此处访问普罗米修斯演示实例我想通过普罗米修斯 AP ...
我使用 prometheus(node-exporter) 但它无法按我想要的方式工作。 我有两个节点导出器,我可以找到它 但我无法获得节点导出器 CPU 我如何获得节点导出器 CPU 并运行查询? ...
我已将警报管理器配置为在实例关闭时向我发送 email,如下所示 但我想为节点导出器服务停止添加另一个角色,我该怎么做? ...
我想在我的服务器上设置节点导出器,以使用 docker compose 进行监控,但不希望所有指标都免费提供。 我当前的 docker-compose.yml 文件如下所示; 当我将底线添加到我的 docker-compose.yml 文件时,我收到错误消息“services.node-expor ...
我有一个 docker-compose.yml 有两个服务,Grafana 和 Ubuntu。我试图通过入口点在 Ubuntu 容器中运行 Prometheus 和 node_exporter 命令,但只适用于第一个命令。 Dockerfile: cstm_入口点.sh: 当检查 web 浏览器 ...
尝试通过 prom 查询node_cpu_seconds_total探索比较上周和本周 CPU 使用率的选项让我知道是否有人遇到过这种情况。 ...
作为监视 Windows 服务器状态的测试环境(CPU、磁盘使用情况、Memory、.network 等),我放置了两个测试节点,在自定义端口上配置了 Windows-Exporter:15000 接下来,我为每个单独的 Windows 实例创建了适当的作业,并在 Grafana 中创建了仪表板。 ...
我开始监视我的家庭网络,对此我有一些疑问。 我的 EdgeRouter 上有节点导出器 mipsel,工作站上有节点导出器 x86_64。 两者都以 15 秒的间隔报废我在路由器上尝试了 1 秒的报废间隔,但这对 EdgeRouter 硬件来说负载太大。 我从我的 Linux 工作站进行了速度测试。 ...
因此,在一台服务器上,我运行 2 个节点,并使用节点导出器在 Grafana 上显示 RAM 指标。 问题是 Grafana 显示服务器的总 RAM 使用情况,但我想分别显示每个节点的 RAM 使用情况。 node_memory_MemTotal_bytes{instance=~"$node"} ...
我有几台服务器,并且在所有情况下都安装了节点导出器。 但是一段时间以来很少有服务器停机。 我想编写一个 Prometheus 查询来查找从过去 X 天下来的实例。 在过去的 X 天里,它不应位于可访问的 state 中。 我试过 min_over_time(up[2d])== 0。 但这对我不起作用 ...
我有一个带有两个 EKS 集群的 AWS 账户,比如 EKS_A 和 EKS_B。 EKS_A 位于 us-east-1 中,EKS_B 位于同一 AWS 账户的 us-west-1 中。 在这些 AWS EKS 集群上,我有运行以下 pod 的 Prometheus 命名空间 - 现在,这些 E ...
我有一个奇怪的设置,我需要将服务器中多个磁盘的读取速率加在一起。 这些查询中的每一个都可以正常工作,但是当我用加号添加它们时,我得到“空查询结果” irate(node_disk_read_bytes_total{instance="10.0.0.10:9100", device="sdc"}[1m ...
背景我正在尝试将整个系统(例如raspberrypi )的能源消耗分配给无服务器功能的 pod。 不幸的是,我收到了奇怪的结果。 我已经完成了整个能量测量设置,并且作为一个简单的开始,我有一个无服务器 function 的 Pod,我们将其命名为analyze-sentence ,部署在OpenFa ...
我正在尝试创建一个表格,其中包含来自 Grafana 的 Alertmanager 的所有活动问题。 我真的找不到关于 Alertmanager Queries 的好的指南,我一直在尝试在表中添加一个带有警报 AGE 的新列(1m、1h 等)。 我在 stackoverflow 上发现了一些东西,它 ...
我们想检测 IaaS 基础设施中的虚拟机是否受到 DDOS 攻击。 我们有几个症状和指标,例如: node_nf_conntrack_entries 、 node_network_receive_packets_total以及libvirt_domain_interface_stats_recei ...