假设您有一个气流 DAG,回填没有意义,这意味着,在它运行一次之后,随后快速运行它是完全没有意义的。
例如,如果您从某个仅每小时更新一次的源加载数据到您的数据库中,那么快速连续发生的回填只会一次又一次地导入相同的数据。
当您实例化一个新的每小时任务时,这尤其令人讨厌,并且它在N
您指定的时间间隔开始运行之前,它错过的每一小时都会运行多次,做多余的工作。
我能想到的唯一解决方案是他们在文档常见问题解答中特别建议的东西
我们建议不要使用动态值作为 start_date,尤其是
datetime.now()
因为它可能会很混乱。
有什么方法可以禁用 DAG 的回填,或者我应该执行上述操作吗?