簡體   English   中英

從普羅米修斯那里刮擦traefik指標

[英]Scraping traefik metrics from prometheus

我正在嘗試從普羅米修斯(Prometheus)抓取traefik指標。

Traefik(最新)作為服務托管在群集集群上,並且Prometheus指標已激活。 匹配的端點是10.200.1.1:8088/metrics

當我從導航器到達端點時,我看到了預期的指標:

...
# HELP traefik_config_last_reload_failure Last config reload failure
# TYPE traefik_config_last_reload_failure gauge
traefik_config_last_reload_failure 0
# HELP traefik_config_last_reload_success Last config reload success
# TYPE traefik_config_last_reload_success gauge
traefik_config_last_reload_success 1.53633684e+09
# HELP traefik_config_reloads_failure_total Config failure reloads
# TYPE traefik_config_reloads_failure_total counter
traefik_config_reloads_failure_total 0
# HELP traefik_config_reloads_total Config reloads
# TYPE traefik_config_reloads_total counter
traefik_config_reloads_total 76
...

因此,對於我的觀點,編輯以下prometheus.yml(並將POST發布到/-/ reload)應該添加這些指標。

global:
  scrape_interval:     15s

rule_files:
  - "targets.rules"
  - "host.rules"
  - "containers.rules"

scrape_configs:

...

  - job_name: 'traefik'
    metrics_path: '/metrics'
    static_configs:
      - targets: ['10.200.1.2:8088']

但不幸的是,這些都沒有出現在prometheus api的下拉列表中。

由於我是traefik和Prometheus的新手,所以我很確定自己理解不對。 我嘗試遵循一些指南(例如指南),但無法使其正常工作(可能與先前版本兼容)。

所以....有人知道我做錯了什么,和/或正確的方法是什么?

一段時間后,進行了許多嘗試和一些相關的問題:我最終認為這與我的配置無關...因此,由於我還觀察到了一些隨機的異常行為(例如,在遠程/ providers調用中出現了503個錯誤),因此我開始認為問題與訪問我的機器有關。

因此,我嘗試降級管理器,並提升集群的另一個節點。 ...而且有效! 我的traefik指標現在出現在普羅米修斯!

我仍然必須了解我的前任經理出了什么問題,但是至少,我正在向前邁進!

感謝@AlinSînpălean和@AndreasJägle的幫助!

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM