我们使用 Amazon MWAA Airflow,很少有标记为“FAILED”的任务,但根本没有日志。好像容器在没有注意到我们的情况下被关闭了。
我找到了这个链接: https : //cloud.google.com/composer/docs/how-to/using/troubleshooting-dags#task_fails_without_emitting_logs 机器上的OOM对此进行了解释。但是我们的任务几乎没有使用 CPU 和 RAM。他们只对 AWS API 进行 1 次 HTTP 调用。所以很轻。
在 Cloudwatch 上,我可以看到没有其他任务在同一个容器上启动(DAG 运行通过打印容器 IP 开始,所以我可以在所有任务上搜索这个 IP)。
如果有人有想法,那就太好了,谢谢!