我正在尝试诊断性能不佳的气流管道,并想知道我应该从气流调度程序中获得什么样的性能,类似于“每秒调度的任务”。
我几乎没有排队的作业,而且我的许多任务在几秒钟内完成,所以我怀疑调度程序是限制组件,我有很多快速任务是我的错。不过,如果可以避免的话,我宁愿不重写我的 DAG。
我可以做些什么来提高调度程序排队任务的速率?
管道详细信息
我只有两个 dags 在运行。一个每 5 分钟安排一次,另一个很少由第一个触发。我目前正试图以这种频率回填几年,但可能需要改变我的方法:
至于工作节点:我目前有 4 个相当强大的服务器运行,在磁盘、网络、cpu、RAM、交换方面的资源使用率不到 10%。关闭 3 个工作人员对我的任务吞吐量没有影响,并且服务器保持打开状态甚至几乎没有记录工作量的变化。