2

我需要在 Ubuntu LTS 上为第 3 方网络文件传输 java 程序编写一个看门狗,该程序每 40-50 分钟持续网络传输@4MB/s 就会死掉。

我无法修改该 java 程序,但它是通过暴发户产生的。

我当前的看门狗正忙着等待:

while monitoring_enabled:
    begin_time = now()
    # query ps and /proc to see if it's there
    end_time = now()
    diff_time = end_time - begin_time
    if not diff_time > sleep_time:
        sleep(sleep_time - diff_time)

因为,“忙等待是不好的”,这会占用大约 10% 的 CPU,我想知道是否有更好的方法来解决这个问题:

  1. 有一个通知/事件处理而不是轮询。请注意,我并不是暗示当进程终止时会触发任何通知/事件,而是询问操作系统是否可以确定 java 程序已经死亡

  2. 修改生成 java 程序的 upstart 脚本,以便在进程停止时重新启动它?

  3. 更好的解决方案?可能类似于Python API 库和 shell 实用程序来监视文件系统事件,但对于 linux 进程

4

2 回答 2

2

主管- Python,生成和控制流程,事件通知,xml-rpc api,好的文档,好的评论

于 2012-08-15T20:48:23.407 回答
0

编写一个 bash 脚本以在 while 循环中运行程序。

#!/bin/bash
while true; do 
    java -jar offendingProgram.jar
done

然后从你启动它的地方 bg 脚本。

于 2012-06-17T18:29:59.277 回答