1

我试图像这样杀死一个 oozie 协调员工作:

$ oozie job -oozie http://10.0.3.2:11000/oozie -kill 0003288-130913181709024-oozie-oozi-C

没有出现任何错误。

但是在我检查了 oozie UI 之后,这个工作仍然存在。

我熟练了几个工作,然后在 oozie 上部署了新的代码更新,开始了新工作。由于无法杀死旧作业,因此现在 Oozie 上有许多具有相同项目“RUNNING”的作业。

我可以杀死以前的工作,但现在不能杀死它。那么,如何强制杀死 RUNNING 作业?你知道是什么导致了这种情况发生吗?

非常感谢。

4

4 回答 4

4

我有时在我的测试环境中遇到这个错误,其中 Oozie 使用 Derby 作为数据库。解决方案是通过删除数据库来清理 Oozie 状态:

sudo /etc/init.d/oozie stop
sudo rm -rf /var/lib/oozie/oozie-db/
sudo /etc/init.d/oozie start

当然,这个解决方案可能不适合生产系统(尽管我在生产中从未见过这个错误)。

于 2013-09-26T12:00:42.400 回答
0

尽管 Derby 已经解决了这个问题,但在将 Oozie 与 Postgresql 数据库一起使用时,我们也看到了这种行为,因此我将在此处发布我们的解决方案,以供将来遇到此问题的任何人使用。解决方案最终是使用 pg_dump 克隆数据库模式

pg_dump --schema-only $OOZIE_DB > outfile
createdb -O $OOZIE_USER $NEW_DB_NAME
psql $NEW_DB_NAME < outfile

这为您提供了一个干净的 Oozie 数据库实例。从那里,更新 Oozie 配置以使用新的(干净的)数据库,然后重新启动 Oozie 服务器。

于 2018-04-18T16:06:00.580 回答
-1

我也遇到过这个问题

只需首先列出 oozie 中的所有工作,然后杀死所需的工作现在非常简单 -

arif@ubuntu:~/applications/hadoop/oozie-4.3.0$ bin/oozie jobs
Job ID                                   App Name     Status    User      Group     Started                 Ended                   
------------------------------------------------------------------------------------------------------------------------------------
0000000-171229155700312-oozie-arif-W     sqoop-wf     RUNNING   arif      -         2017-12-29 10:55 GMT    -                       
------------------------------------------------------------------------------------------------------------------------------------
0000002-171229093438895-oozie-arif-W     sqoop-wf     FAILED    arif      -         2017-12-29 06:30 GMT    2017-12-29 11:39 GMT    
------------------------------------------------------------------------------------------------------------------------------------
0000001-171229093438895-oozie-arif-W     sqoop-wf     FAILED    arif      -         2017-12-29 06:21 GMT    2017-12-29 06:21 GMT    
------------------------------------------------------------------------------------------------------------------------------------
0000000-171229093438895-oozie-arif-W     sqoop-wf     FAILED    arif      -         2017-12-29 06:13 GMT    2017-12-29 06:13 GMT    
------------------------------------------------------------------------------------------------------------------------------------
arif@ubuntu:~/applications/hadoop/oozie-4.3.0$ bin/oozie jobs -jobtype coordinator
No Jobs match your criteria!
arif@ubuntu:~/applications/hadoop/oozie-4.3.0$ bin/oozie job -kill 0000000-171229155700312-oozie-arif-W
arif@ubuntu:~/applications/hadoop/oozie-4.3.0$ bin/oozie jobs
Job ID                                   App Name     Status    User      Group     Started                 Ended                   
------------------------------------------------------------------------------------------------------------------------------------
0000000-171229155700312-oozie-arif-W     sqoop-wf     KILLED    arif      -         2017-12-29 10:55 GMT    2017-12-29 11:54 GMT    
------------------------------------------------------------------------------------------------------------------------------------
0000002-171229093438895-oozie-arif-W     sqoop-wf     FAILED    arif      -         2017-12-29 06:30 GMT    2017-12-29 11:39 GMT    
------------------------------------------------------------------------------------------------------------------------------------
0000001-171229093438895-oozie-arif-W     sqoop-wf     FAILED    arif      -         2017-12-29 06:21 GMT    2017-12-29 06:21 GMT    
------------------------------------------------------------------------------------------------------------------------------------
0000000-171229093438895-oozie-arif-W     sqoop-wf     FAILED    arif      -         2017-12-29 06:13 GMT    2017-12-29 06:13 GMT    
------------------------------------------------------------------------------------------------------------------------------------

希望它会帮助别人,谢谢。

于 2017-12-29T12:00:20.860 回答
-1

这也发生在我的 Oozie 服务器上,它在测试环境中。这是在资源管理器关闭并且 Oozie 尝试将作业提交给 RM 时引起的。

为了克服这个问题,我从我的 MySQL 表中删除了该作业的条目(而不是删除整个数据库)并重新启动该作业:

mysql> delete from WF_JOBS where id="Wf-id";
于 2018-09-03T10:05:22.483 回答