我需要在 Ubuntu LTS 上为第 3 方网络文件传输 java 程序编写一个看门狗,该程序每 40-50 分钟持续网络传输@4MB/s 就会死掉。
我无法修改该 java 程序,但它是通过暴发户产生的。
我当前的看门狗正忙着等待:
while monitoring_enabled:
begin_time = now()
# query ps and /proc to see if it's there
end_time = now()
diff_time = end_time - begin_time
if not diff_time > sleep_time:
sleep(sleep_time - diff_time)
因为,“忙等待是不好的”,这会占用大约 10% 的 CPU,我想知道是否有更好的方法来解决这个问题:
有一个通知/事件处理而不是轮询。请注意,我并不是暗示当进程终止时会触发任何通知/事件,而是询问操作系统是否可以确定 java 程序已经死亡
修改生成 java 程序的 upstart 脚本,以便在进程停止时重新启动它?
更好的解决方案?可能类似于Python API 库和 shell 实用程序来监视文件系统事件,但对于 linux 进程