0

我必须在 hadoop 1.0.4 中运行许多(可能是 12 个)作业。我希望首先并行运行 5 个,然后在全部完成后并行运行 4 个其他作业,最后再次运行最后 3 个以并行运行。我如何在 hadoop 1.0.4 中设置它,因为我看到所有作业都相互运行而不是并行运行。

4

1 回答 1

2

JobControl API 可用于 MR 作业依赖。对于复杂的工作流程,推荐使用OozieAzkaban是Oozie vs Azkaban,

于 2013-04-10T12:24:02.947 回答