0

我们正在评估 Argo 工作流程的性能并尝试对其进行基准测试。可以肯定的是,Argo 涉及的组件数量少于 Airflow,但我们想了解大规模运行时的各种潜在瓶颈。

以下 ( https://argoproj.github.io/argo-workflows/metrics/ ) 是 Argo-workflows (localhost:9090/metrics) 的 workflow-controller-metrics,寻找对这些的解释。

  1. 看到列出的 5 个不同的队列(cron_wf_queue、pod_queue、wf_cron_queue、workflow_queue、workflow_ttl_queue),每个队列的意义是什么?
# HELP argo_workflows_queue_adds_count Adds to the queue
# TYPE argo_workflows_queue_adds_count counter

argo_workflows_queue_adds_count{queue_name="cron_wf_queue"} 0
argo_workflows_queue_adds_count{queue_name="pod_queue"} 119
argo_workflows_queue_adds_count{queue_name="wf_cron_queue"} 0
argo_workflows_queue_adds_count{queue_name="workflow_queue"} 91
argo_workflows_queue_adds_count{queue_name="workflow_ttl_queue"} 0

2)以下指标是什么意思?这里的“乐”是什么?

# HELP argo_workflows_queue_latency Time objects spend waiting in the queue
# TYPE argo_workflows_queue_latency histogram
argo_workflows_queue_latency_bucket{queue_name="cron_wf_queue",le="1"} 0
argo_workflows_queue_latency_bucket{queue_name="cron_wf_queue",le="5"} 0
argo_workflows_queue_latency_bucket{queue_name="cron_wf_queue",le="20"} 0

3)这两组队列是什么?一个用于工作流控制器,另一组队列用于 Argo-server?如果是,每个队列在做什么? Argo grafana 仪表板

4

1 回答 1

0

我的理解是,柜台

argo_workflows_queue_adds_count

是“工作流程添加”。这些计数器在进入特定队列时递增。您可以在 Prometheus 中使用deltarate表达式来查找在给定时间范围内发生了多少排队。

您问题的第二部分是直方图类型的度量。在这里你有不同的桶。le意味着小于或等于。例如,一个对象在结果中等待20秒会cron_wf_queue导致每个桶中的一个增量。

花 le 1 秒。

花 le 5 秒。

花 le 20 秒。

还有一个Grafana 仪表板可用于可视化 Argo Workflow 指标。

于 2022-01-12T10:29:43.070 回答