2

我有一个 Hive 脚本,我每 10 分钟使用 Oozie 协调器执行一次。当我启动我的 Oozie coordinator-app 时,假设我在 08:03 开始​​,第一个工作流在那个时间开始,接下来是 08:13,然后是 08:23,以此类推。

我想要的是每个时钟时间 hh:mm 执行工作流,其中 mm 可以被 10 整除。假设上面相同的场景,我想要发生的是:第一个工作流将在 08:10 执行,然后是 08: 20,以此类推。

我如何在 Oozie 中执行此操作?每 5 分钟(最后一个 m 是 5 或 0)怎么样?感谢您的输入。

4

1 回答 1

2

为了以一定频率运行协调器作业,您可以使用以下指令

<coordinator-app name="app" frequency="10" start="2015-07-10T12:00Z" end="2016-01-01T00:00Z" timezone="UTC" xmlns="uri:oozie:coordinator:0.1">

这将每 10 分钟运行一次,从今天 12:00 UTC 时间开始。每 5 分钟运行一次也是如此,只需替换frequency="10"frequency="5". 要让它每 N 分钟被 M 整除一次,你必须确保你的start参数设置正确。

如果您使用的是更新版本的 Oozie (4.1.0),另一种选择是使用类似 cron 的调度程序。如果您熟悉的话,这将允许您以类似 cron 的方式安排 Oozie 协调器。请参阅http://blog.cloudera.com/blog/2014/04/how-to-use-cron-like-scheduling-in-apache-oozie/https://issues.apache.org/jira/browse/ OOZIE-1306

于 2015-07-10T14:28:46.907 回答