我需要运行由不同项目中的多个脚本组成的数据转换管道 = Python repos。
我正在考虑在需要时使用 Compute Engine 在虚拟机中运行这些脚本,因为我可以管理所需的资源。我需要能够编排这些脚本,因为我想按顺序运行步骤,有时是异步运行。
我看到 GCP 为我们提供了一个似乎适合这种情况的 Worflows 组件。我正在考虑创建一个特定的项目来协调脚本的执行。但是,我看不到如何触发我的脚本的执行,这些脚本与编排器项目不在同一个仓库中。根据我对 GCE 的了解,VM 仅在执行脚本时创建,并且不提供要调用的持久 HTTP 端点以从其他地方触发执行。
为了说明,假设我有两个项目step_1和step_2,它们包含我的数据转换管道的单独步骤。我还会有一个项目编排器,它只能在带有 GCE 的 VM 中按顺序触发step_1和step_2 。该项目将无法访问这两个以前项目的代码库。
在这种情况下,最佳做法是什么?我应该为此使用 GCE 和 Worflows 以外的其他组件,还是有办法从独立的编排项目中触发 GCE 中的脚本?