[英]Argo Workflow + Performance evaluation + Metrics
我們正在評估 Argo 工作流程的性能並嘗試對其進行基准測試。 當然,Argo 中涉及的組件數量少於 Airflow,但我們想了解大規模運行時的各種潛在瓶頸。
以下 ( https://argoproj.github.io/argo-workflows/metrics/ ) 是 Argo-workflows (localhost:9090/metrics) 的 workflow-controller-metrics,尋找對這些的解釋。
# HELP argo_workflows_queue_adds_count Adds to the queue
# TYPE argo_workflows_queue_adds_count counter
argo_workflows_queue_adds_count{queue_name="cron_wf_queue"} 0
argo_workflows_queue_adds_count{queue_name="pod_queue"} 119
argo_workflows_queue_adds_count{queue_name="wf_cron_queue"} 0
argo_workflows_queue_adds_count{queue_name="workflow_queue"} 91
argo_workflows_queue_adds_count{queue_name="workflow_ttl_queue"} 0
2)以下指標是什么意思? 這里的“樂”是什么?
# HELP argo_workflows_queue_latency Time objects spend waiting in the queue
# TYPE argo_workflows_queue_latency histogram
argo_workflows_queue_latency_bucket{queue_name="cron_wf_queue",le="1"} 0
argo_workflows_queue_latency_bucket{queue_name="cron_wf_queue",le="5"} 0
argo_workflows_queue_latency_bucket{queue_name="cron_wf_queue",le="20"} 0
我的理解是,櫃台
argo_workflows_queue_adds_count
是“工作流程添加”。 這些計數器在進入特定隊列時遞增。 您可以在 Prometheus 中使用delta或rate表達式來查找在給定時間范圍內發生了多少排隊。
您問題的第二部分是直方圖類型的度量。 在這里你有不同的桶。 le
表示小於或等於。 例如,在 cron_wf_queue 中等待20秒的cron_wf_queue
會導致每個存儲桶中的增量。
花 le 1 秒。
花 le 5 秒。
花 le 20 秒。
還有一個Grafana 儀表板可用於可視化 Argo Workflow 指標。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.