1

From documentation, it isn't very clear whether oozie can schedule and control jobs outside of Hadoop? Can someone shed some light on this? If not, is there any open source based workflow engine which can do that?

4

4 回答 4

2

尝试考虑使用 chronos(来自 airbnb)高级版本的 cron 和 UI,建立在 mesos 之上。airbnb.github.com/chronos/

干杯。

于 2013-03-20T15:58:23.043 回答
1

我相信没有。因为 Oozie 本身没有资源管理策略,它所做的只是在正确的时间向 Hadoop 的作业跟踪器提交作业。此外,对于每个 Oozie 工作流,都会有一个启动器作业,负责将工作流中的真实作业提交给 Hadoop。启动器作业本身就是 Hadoop 作业。所以,我认为对于 Oozie 3.2 之前的版本,答案应该是否定的。

于 2012-11-03T02:36:11.187 回答
0

您可以考虑通过链接来尝试 azkaban。它是专门为 hadoop 构建的。但是可以在 azkaban 的作业文件中指定 unix 命令。因此,您可以为任何可以使用命令行运行的应用程序开发工作流程。

于 2013-01-09T20:03:46.380 回答
-1

我一直在研究一个名为 Soop 的新工作流引擎。https://github.com/radixCSgeek/soop它非常轻量级,使用类似 cron 的语法设置和运行非常简单。它可以运行任何 Java POJO 以及运行 shell 进程,因此您可以启动 bash 脚本或其他任何东西。

于 2014-04-15T08:27:00.133 回答