簡體   English   中英

Argo 工作流程 + 績效評估 + 指標

[英]Argo Workflow + Performance evaluation + Metrics

我們正在評估 Argo 工作流程的性能並嘗試對其進行基准測試。 當然,Argo 中涉及的組件數量少於 Airflow,但我們想了解大規模運行時的各種潛在瓶頸。

以下 ( https://argoproj.github.io/argo-workflows/metrics/ ) 是 Argo-workflows (localhost:9090/metrics) 的 workflow-controller-metrics,尋找對這些的解釋。

  1. 看到列出的 5 個不同的隊列(cron_wf_queue、pod_queue、wf_cron_queue、workflow_queue、workflow_ttl_queue),每個隊列的意義是什么?
# HELP argo_workflows_queue_adds_count Adds to the queue
# TYPE argo_workflows_queue_adds_count counter

argo_workflows_queue_adds_count{queue_name="cron_wf_queue"} 0
argo_workflows_queue_adds_count{queue_name="pod_queue"} 119
argo_workflows_queue_adds_count{queue_name="wf_cron_queue"} 0
argo_workflows_queue_adds_count{queue_name="workflow_queue"} 91
argo_workflows_queue_adds_count{queue_name="workflow_ttl_queue"} 0

2)以下指標是什么意思? 這里的“樂”是什么?

# HELP argo_workflows_queue_latency Time objects spend waiting in the queue
# TYPE argo_workflows_queue_latency histogram
argo_workflows_queue_latency_bucket{queue_name="cron_wf_queue",le="1"} 0
argo_workflows_queue_latency_bucket{queue_name="cron_wf_queue",le="5"} 0
argo_workflows_queue_latency_bucket{queue_name="cron_wf_queue",le="20"} 0

3)這兩組隊列是什么? 一個用於工作流控制器,另一組隊列用於 Argo-server? 如果是,每個隊列在做什么? Argo grafana 儀表板

我的理解是,櫃台

argo_workflows_queue_adds_count

是“工作流程添加”。 這些計數器在進入特定隊列時遞增。 您可以在 Prometheus 中使用deltarate表達式來查找在給定時間范圍內發生了多少排隊。

您問題的第二部分是直方圖類型的度量。 在這里你有不同的桶。 le表示小於或等於。 例如,在 cron_wf_queue 中等待20秒的cron_wf_queue會導致每個存儲桶中的增量。

花 le 1 秒。

花 le 5 秒。

花 le 20 秒。

還有一個Grafana 儀表板可用於可視化 Argo Workflow 指標。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM