2

我想在将新文件添加到存储桶时触发 Dataflow 作业,以便处理新数据并将其添加到 BigQuery 表中。我看到存储桶中的更改可以触发Cloud Functions ,但我还没有找到使用gcloud node.js library启动 Dataflow 作业的方法。

有没有办法使用 Cloud Functions 来做到这一点,或者是否有其他方法可以实现所需的结果(将文件添加到存储桶时将新数据插入 BigQuery)?

4

2 回答 2

2

从 2.2 开始的 Apache Beam 支持此功能。请参阅在 Apache Beam 中查看与文件模式匹配的新文件

于 2016-04-01T20:31:50.497 回答
2

也许这篇文章有助于了解如何从 App Engine 或 Cloud Functions 触发 Dataflow 管道?

https://cloud.google.com/blog/big-data/2016/04/scheduling-dataflow-pipelines-using-app-engine-cron-service-or-cloud-functions

于 2016-04-16T18:41:07.623 回答