0

有人在生产中使用 MWAA 吗?

我们目前有大约 500 个 DAG 正在运行,并且我们看到了一种意外行为,任务由于未知原因而处于“排队”状态。

任务处于“排队”状态,这不是执行的有效状态。必须清除任务才能运行。

它是随机发生的,可以完美运行一天,然后一些任务将保持排队。除非我们手动将它们标记为失败,否则这些任务将永远保持这种状态。

即使池是空的,DAG 运行也可以保持这种“排队”状态,我没有看到任何解释这一点的原因。

它发生在约 5% 的任务上,而其他所有任务都运行顺利。

你有没有遇到过这种行为?

4

0 回答 0