python - Python中无限期的守护进程生成

Question

我正在尝试构建一个 Python 守护程序来启动其他完全独立的进程。

一般的想法是对于给定的 shell 命令，每隔几秒轮询一次，并确保该命令的恰好k个实例正在运行。我们保留一个 pidfiles 目录，当我们轮询时，我们删除 pids 不再运行的 pidfiles 并启动（并为其创建 pidfiles），但是我们需要获取其中的k个进程。

子进程也需要完全独立，这样如果父进程死了，子进程就不会被杀死。从我读过的内容来看，似乎没有办法用subprocess模块做到这一点。为此，我使用了这里提到的代码段：

http://code.activestate.com/recipes/66012-fork-a-daemon-process-on-unix/

我做了一些必要的修改（你会看到附加代码段中注释掉的行）：

原来的父进程无法退出，因为我们需要启动器守护进程无限期地持续存在。
子进程需要以与父进程相同的 cwd 开始。

这是我的 spawn fn 和一个测试：

import os
import sys
import subprocess
import time

def spawn(cmd, child_cwd):
    """
    do the UNIX double-fork magic, see Stevens' "Advanced 
    Programming in the UNIX Environment" for details (ISBN 0201563177)
    http://www.erlenstar.demon.co.uk/unix/faq_2.html#SEC16
    """
    try: 
        pid = os.fork() 
        if pid > 0:
            # exit first parent
            #sys.exit(0) # parent daemon needs to stay alive to launch more in the future
            return
    except OSError, e: 
        sys.stderr.write("fork #1 failed: %d (%s)\n" % (e.errno, e.strerror))
        sys.exit(1)

    # decouple from parent environment
    #os.chdir("/") # we want the children processes to 
    os.setsid() 
    os.umask(0) 

    # do second fork
    try: 
        pid = os.fork() 
        if pid > 0:
            # exit from second parent
            sys.exit(0) 
    except OSError, e: 
        sys.stderr.write("fork #2 failed: %d (%s)\n" % (e.errno, e.strerror))
        sys.exit(1) 

    # redirect standard file descriptors
    sys.stdout.flush()
    sys.stderr.flush()
    si = file('/dev/null', 'r')
    so = file('/dev/null', 'a+')
    se = file('/dev/null', 'a+', 0)
    os.dup2(si.fileno(), sys.stdin.fileno())
    os.dup2(so.fileno(), sys.stdout.fileno())
    os.dup2(se.fileno(), sys.stderr.fileno())

    pid = subprocess.Popen(cmd, cwd=child_cwd, shell=True).pid

    # write pidfile       
    with open('pids/%s.pid' % pid, 'w') as f: f.write(str(pid))
    sys.exit(1)

def mkdir_if_none(path):
    if not os.access(path, os.R_OK):
        os.mkdir(path)

if __name__ == '__main__':
    try:
        cmd = sys.argv[1]
        num = int(sys.argv[2])
    except:
        print 'Usage: %s <cmd> <num procs>' % __file__
        sys.exit(1)
    mkdir_if_none('pids')
    mkdir_if_none('test_cwd')

    for i in xrange(num):
        print 'spawning %d...'%i
        spawn(cmd, 'test_cwd')
        time.sleep(0.01) # give the system some breathing room

在这种情况下，事情似乎工作正常，即使父进程被杀死，子进程仍然存在。但是，我仍然遇到原始父母的产卵限制。在大约 650 次生成之后（不是同时，子进程已经完成），父进程因错误而窒息：

spawning 650...
fork #2 failed: 35 (Resource temporarily unavailable)

有什么方法可以重写我的 spawn 函数，以便我可以无限期地生成这些独立的子进程？谢谢！

score 5 · Accepted Answer

感谢您的流程列表，我愿意说这是因为您遇到了许多基本限制之一：

rlimitnproc允许给定用户执行的最大进程数 - 请参阅setrlimit(2)内置bash(1) ulimit的，以及/etc/security/limits.conf有关每个用户进程限制的详细信息。
rlimitnofile允许给定进程一次打开的最大文件描述符数。（每个新进程可能会在父进程中为子进程的stdin、stdout和stderr描述符创建三个新管道。）
系统范围的最大进程数；见/proc/sys/kernel/pid_max。
系统范围的最大打开文件数；见/proc/sys/fs/file-max。

因为你不是在收割你死去的孩子，所以这些资源中的许多资源的开放时间都超过了它们应有的时间。你的第二个孩子正在被妥善处理init(8)——他们的父母已经死了，所以他们被重新抚养init(8)，并且init(8)会在他们死后清理他们（wait(2)）。

但是，您的程序负责在第一组孩子之后进行清理。C 程序通常为该调用安装一个signal(7)处理程序或获取子进程的退出状态，从而从内核内存中删除其条目。SIGCHLDwait(2)waitpid(2)

但是脚本中的信号处理有点烦人。如果您可以将SIGCHLD信号处置SIG_IGN显式设置为，内核将知道您对退出状态不感兴趣，并将为您收割孩子_。

尝试添加：

import signal
signal.signal(signal.SIGCHLD, signal.SIG_IGN)

靠近程序顶部。

请注意，我不知道这是做什么用的Subprocess。它可能不高兴。如果是这种情况，那么您需要安装一个信号处理程序来为您调用wait(2)。

score 3 · Accepted Answer

我稍微修改了您的代码，并且能够运行 5000 个进程而没有任何问题。因此，我同意@sarnold 的观点，即您遇到了一些基本限制。我的修改是：

proc = subprocess.Popen(cmd, cwd=child_cwd, shell=True, close_fds=True)    
pid = proc.pid

# write pidfile       
with open('pids/%s.pid' % pid, 'w') as f: f.write(str(pid))
proc.wait()
sys.exit(1)

python - Python中无限期的守护进程生成

2 回答 2

Related

Reference