2

我在 .pig 文件中有一些猪批处理作业,我希望每隔一小时左右在 EMR 上自动运行一次。我在这里找到了一个这样做的教程,但这需要为我设置的每项工作使用亚马逊的 GUI,我真的宁愿避免。有没有使用 Whirr 的好方法?还是 Ruby Elastic-mapreduce 客户端?我的所有文件都在 s3 中,还有几个带有我需要使用的功能的猪罐子。

4

1 回答 1

-1

虽然我不知道如何使用您提到的工具运行 pig 脚本,但我知道两种可能的方法:

  1. 在本地运行文件:您可以使用 cron
  2. 在集群上运行文件:可以使用 OOZIE

话虽如此,大多数带有 GUI 的工具也可以通过命令行进行控制。(虽然如果您有可用的 GUI,设置可能会更容易)。

于 2016-06-06T10:49:29.433 回答