2

我已经使用 HIVE 和 PIG 构建并存储了我希望每周运行的查询。这些脚本创建 S3 文件并更新 DynamoTables。我可以使用什么来创建 AmazonEMR 集群以按计划自动运行这些脚本。

我在考虑 AWS Data Pipeline,但它似乎需要创建数据节点,我认为这对于我的目的来说是不必要的。

4

1 回答 1

0

如果在 HiveActivity 上禁用暂存,则不需要指定数据节点。

阶段 = 假

请参阅这篇文章中的示例

于 2015-02-17T00:44:39.593 回答