在 Apache Oozie、Spotify/Luigi和airbnb/airflow之间,它们各自的优缺点是什么?
我过去曾使用 oozie 和气流来构建使用 PIG 和 Hive 的数据摄取管道。目前,我正在构建一个查看日志并提取有用事件并将它们置于红移状态的管道。
我发现气流更容易使用/测试/设置。它有一个更酷的 UI,并允许用户从 UI 本身执行操作,这与 Oozie 不同。欢迎提供有关 Luigi 的任何信息或其他有关稳定性和问题的见解。
在 Apache Oozie、Spotify/Luigi和airbnb/airflow之间,它们各自的优缺点是什么?
我过去曾使用 oozie 和气流来构建使用 PIG 和 Hive 的数据摄取管道。目前,我正在构建一个查看日志并提取有用事件并将它们置于红移状态的管道。
我发现气流更容易使用/测试/设置。它有一个更酷的 UI,并允许用户从 UI 本身执行操作,这与 Oozie 不同。欢迎提供有关 Luigi 的任何信息或其他有关稳定性和问题的见解。
恕我直言,Azkaban 强制执行简单性(不能使用不存在的功能),而其他人则巧妙地鼓励复杂性。
更简单的管道比复杂的管道更好:更容易创建,更容易理解(尤其是当你没有创建时)并且更容易调试/修复。
当需要复杂的操作时,您希望以完全成功或完全失败的方式封装它们。
如果您可以使其具有幂等性(再次运行它会产生相同的结果),那就更好了。
这篇文章将让您初步了解不同的可能工作流程