是否有一个很好的框架作为驱动 Hive 查询的工作流?我查看了 Hamake、Oozie、Azkaban 和 Cascading,但似乎它们不适合这个目的。我目前正在使用 shell 脚本来执行此操作,但随着我们业务流程的发展,它变得越来越混乱。
问问题
234 次
2 回答
0
我没有过多关注许多工作流引擎,但很多人(包括我自己)使用 Hive 客户端(https://cwiki.apache.org/Hive/hiveclient.html)从他们选择的语言发出 Hive 查询。
于 2012-05-11T03:47:42.897 回答
0
如果您想在输入数据到达或修改时运行配置单元查询,Hamake 非常好。如果您想在给定的时间表上运行您的配置单元查询,Oozie 是很好的选择。
于 2013-08-16T07:07:34.883 回答