将新的 dags 部署到气流中是否遵循任何最佳实践?
我在谷歌论坛上看到了一些评论,指出 dag 保存在 GIT 存储库中,并且会定期同步到气流集群中的本地位置。
关于这种方法,我有几个问题
非常感谢这里的任何帮助。如果您需要更多详细信息,请告诉我?
将新的 dags 部署到气流中是否遵循任何最佳实践?
我在谷歌论坛上看到了一些评论,指出 dag 保存在 GIT 存储库中,并且会定期同步到气流集群中的本地位置。
关于这种方法,我有几个问题
非常感谢这里的任何帮助。如果您需要更多详细信息,请告诉我?
以下是我们为团队管理它的方式。
首先在命名约定方面,我们的每个DAG 文件名都与来自 DAG 本身(包括 DAG 版本)内容的DAG Id匹配。这很有用,因为最终它是您在 Airflow UI 中看到的 DAG Id,因此您将确切知道每个 DAG 后面使用了哪个文件。
像这样的 DAG 示例:
from airflow import DAG
from datetime import datetime, timedelta
default_args = {
'owner': 'airflow',
'depends_on_past': False,
'start_date': datetime(2017,12,05,23,59),
'email': ['me@mail.com'],
'email_on_failure': True
}
dag = DAG(
'my_nice_dag-v1.0.9', #update version whenever you change something
default_args=default_args,
schedule_interval="0,15,30,45 * * * *",
dagrun_timeout=timedelta(hours=24),
max_active_runs=1)
[...]
DAG 文件的名称为:my_nice_dag-v1.0.9.py
好处