Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
在文档中,我没有提到以编程方式触发工作流(例如,将数据从 RDBMS 加载到 S3 中)。我也没有在 AWS Lake Formation 的 API 规范中找到任何内容。我们使用 Airflow 来调度我们的 ETL 管道,如果我们可以通过 API 调用触发 Workflow,那就太好了。
Lake Formation 用于指定 Glue Catalog 中表和列的权限。它不管理 ETL。您可以使用 Glue 设置爬虫以从 RDBMS 下载数据。爬虫可以是 Glue 工作流的一部分。
参考链接:
为 RDBMS 添加爬虫的文档
Glue API 启动爬虫
Glue API 以启动工作流程