我有一个服务器进程,可以给这个服务器进程一个命令来更新自己。它所做的是存储更新,然后使用 system() 在后台运行更新脚本。更新脚本杀死父进程,删除二进制文件,替换它,然后重新启动它。
重新启动的进程由于各种原因失败,因为我试图调试它,但这一次,这是因为我试图分配的 TCP 端口已经在使用中。我猜测子进程继承了打开的端口,然后由更新的服务器进程继承,因此,该端口没有空闲供进程再次分配。
更新脚本的启动方式是这样的:
system("/usr/local/bin/update_script.sh > /dev/null 2>&1 &");
然后脚本执行此操作:
killall server_process
rm /usr/local/bin/server_process
cp /tmp/update/server_process /usr/local/bin
server_process > /dev/null 2>&1 &
关于如何完成这项工作的任何建议?有什么方法可以分离更新脚本,以便服务器进程在执行更新之前不再是其父进程?还是让子进程不继承父进程的任何资源?
谢谢。
附录:解决方案是FD_CLOEXEC
在每个打开的文件描述符上进行设置。不幸的是,其中一些 fd 被埋在库中,我必须认真地破解才能使它们设置FD_CLOEXEC
。不知何故,我需要FD_CLOEXEC
设置默认值。或者我需要做一些激烈的事情,比如遍历所有打开的 fd(如何?)和 set FD_CLOEXEC
。