处理需要我从一个 postgres 表中提取数据并将数据更新到另一个环境中的另一个 Postgres 表的 ETL 过程(相同的列名)。目前,我正在 Windows EC2 实例中运行 python 作业,并且我正在使用pangres upsert 库来更新现有行并插入新行。
但是,我的组织希望我在 AWS 上的托管 Apache Airflow 中移动 python ETL 脚本。
我一直在学习 DAG,大部分教程和文章都是关于使用钩子或运算符从 postgres 表中查询数据。
但是,我希望了解如何使用表 B 中的新记录增量更新现有表 A(即 upsert)(并忽略/覆盖现有的匹配行)。
任何解释如何执行这个简单任务的代码块 (DAG) 都会非常有帮助。