從普羅米修斯那里刮擦traefik指標

Question

我正在嘗試從普羅米修斯（Prometheus）抓取traefik指標。

Traefik（最新）作為服務托管在群集集群上，並且Prometheus指標已激活。 匹配的端點是10.200.1.1:8088/metrics

當我從導航器到達端點時，我看到了預期的指標：

...
# HELP traefik_config_last_reload_failure Last config reload failure
# TYPE traefik_config_last_reload_failure gauge
traefik_config_last_reload_failure 0
# HELP traefik_config_last_reload_success Last config reload success
# TYPE traefik_config_last_reload_success gauge
traefik_config_last_reload_success 1.53633684e+09
# HELP traefik_config_reloads_failure_total Config failure reloads
# TYPE traefik_config_reloads_failure_total counter
traefik_config_reloads_failure_total 0
# HELP traefik_config_reloads_total Config reloads
# TYPE traefik_config_reloads_total counter
traefik_config_reloads_total 76
...

因此，對於我的觀點，編輯以下prometheus.yml（並將POST發布到/-/ reload）應該添加這些指標。

global:
  scrape_interval:     15s

rule_files:
  - "targets.rules"
  - "host.rules"
  - "containers.rules"

scrape_configs:

...

  - job_name: 'traefik'
    metrics_path: '/metrics'
    static_configs:
      - targets: ['10.200.1.2:8088']

但不幸的是，這些都沒有出現在prometheus api的下拉列表中。

由於我是traefik和Prometheus的新手，所以我很確定自己理解不對。 我嘗試遵循一些指南（例如本指南），但無法使其正常工作（可能與先前版本兼容）。

所以....有人知道我做錯了什么，和/或正確的方法是什么？

Answer 1

一段時間后，進行了許多嘗試和一些相關的問題：我最終認為這與我的配置無關...因此，由於我還觀察到了一些隨機的異常行為（例如，在遠程/ providers調用中出現了503個錯誤），因此我開始認為問題與訪問我的機器有關。

因此，我嘗試降級管理器，並提升集群的另一個節點。 ...而且有效！ 我的traefik指標現在出現在普羅米修斯！

我仍然必須了解我的前任經理出了什么問題，但是至少，我正在向前邁進！

感謝@AlinSînpălean和@AndreasJägle的幫助！

從普羅米修斯那里刮擦traefik指標

問題描述

1 個解決方案

解決方案1
0 2018-09-10 14:31:08

從普羅米修斯那里刮擦traefik指標

問題描述

1 個解決方案

解決方案1 0 2018-09-10 14:31:08

解決方案1
0 2018-09-10 14:31:08