我们正在评估 Argo 工作流程的性能并尝试对其进行基准测试。可以肯定的是,Argo 涉及的组件数量少于 Airflow,但我们想了解大规模运行时的各种潜在瓶颈。
以下 ( https://argoproj.github.io/argo-workflows/metrics/ ) 是 Argo-workflows (localhost:9090/metrics) 的 workflow-controller-metrics,寻找对这些的解释。
- 看到列出的 5 个不同的队列(cron_wf_queue、pod_queue、wf_cron_queue、workflow_queue、workflow_ttl_queue),每个队列的意义是什么?
# HELP argo_workflows_queue_adds_count Adds to the queue
# TYPE argo_workflows_queue_adds_count counter
argo_workflows_queue_adds_count{queue_name="cron_wf_queue"} 0
argo_workflows_queue_adds_count{queue_name="pod_queue"} 119
argo_workflows_queue_adds_count{queue_name="wf_cron_queue"} 0
argo_workflows_queue_adds_count{queue_name="workflow_queue"} 91
argo_workflows_queue_adds_count{queue_name="workflow_ttl_queue"} 0
2)以下指标是什么意思?这里的“乐”是什么?
# HELP argo_workflows_queue_latency Time objects spend waiting in the queue
# TYPE argo_workflows_queue_latency histogram
argo_workflows_queue_latency_bucket{queue_name="cron_wf_queue",le="1"} 0
argo_workflows_queue_latency_bucket{queue_name="cron_wf_queue",le="5"} 0
argo_workflows_queue_latency_bucket{queue_name="cron_wf_queue",le="20"} 0