2

我有一些在 Windows 上运行的 Python 代码,它产生一个子进程并等待它完成。子进程表现不佳,因此脚本会进行非阻塞生成调用并在旁边监视进程。如果达到某个超时阈值,它会终止进程,假设它已经脱离了轨道。

在某些不可重现的情况下,生成的子进程将消失,并且观察者例程不会注意到这一事实。它会一直观察直到超过超时阈值,尝试杀死子进程并得到错误,然后退出。

什么可能导致子进程已经消失而无法被观察者进程检测到?为什么调用 to 时没有捕获和返回返回码Popen.poll()

我用来生成和观察过程的代码如下:

import subprocess
import time

def nonblocking_subprocess_call(cmdline):
    print 'Calling: %s' % (' '.join(cmdline))
    p = subprocess.Popen(cmdline, shell=False, stdout=subprocess.PIPE, stderr=subprocess.STDOUT)
    return p


def monitor_subprocess(handle, timeout=1200):
    start_time = time.time()
    return_code = 0
    while True:
        time.sleep(60)
        return_code = handle.poll()
        if return_code == None:
            # The process is still running.
            if time.time() - start_time > timeout:
                print 'Timeout (%d seconds) exceeded -- killing process %i' % (timeout, handle.pid)
                return_code = handle.terminate()
                # give the kill command a few seconds to work
                time.sleep(5)
                if not return_code:
                    print 'Error: Failed to kill subprocess %i -- return code was: %s' % (handle.pid, str(return_code))
                # Raise an error to indicate that the process was hung up
                # and we had to kill it.
                raise RuntimeError
        else:
            print 'Process exited with return code: %i' % (return_code)
            break
    return return_code

我所看到的是,在进程消失的情况下,return_code = handle.poll()对第 15 行的调用正在返回None而不是返回代码。我知道这个过程已经完全消失了——我可以看到它不再存在于任务管理器中。而且我知道该过程在达到超时值之前很久就消失了。

4

3 回答 3

1

你能举一个你的 cmdline 变量的例子吗?还有你在产生什么样的子进程?

我在测试脚本上运行它,使用以下命令调用批处理文件:

ping -n 151 127.0.0.1>nul
  • 睡眠 150 秒

它工作得很好。

可能是您的子进程未正确终止。另外,尝试将您的睡眠命令更改为类似 time.sleep(2) 的命令。

在过去,我发现这比更长的睡眠更好(特别是如果您的子进程是另一个 python 进程)。

另外,我不确定你的脚本是否有这个,但在 else: 语句中,你有一个额外的括号。

else:
    #print 'Process exited with return code: %i' % (return_code))
    # There's an extra closing parenthesis
    print 'Process exited with return code: %i' % (return_code)
    break

以及为什么在 join 语句中调用了全局 temp_cmdline:

print 'Calling: %s' % (' '.join(temp_cmdline))

我不确定是否从列表变量 temp_cmdline 中解析了 cmdline,或者是否从空格上拆分的字符串创建了 temp_cmdline。无论哪种方式,如果您的 cmdline 变量是一个字符串,那么只打印它会更有意义吗?

print 'Calling: %s' % cmdline
于 2012-11-08T22:55:19.350 回答
1

子进程对象上的 poll 方法似乎不太好用。当我产生一些线程来做一些工作时,我曾经遇到过同样的问题。我建议您使用多处理模块。

于 2012-11-08T23:24:21.090 回答
0

如果 stdout 被其他东西捕获,Popen.poll 不会按预期工作,您可以检查取出这部分代码“,stdout = subprocess.PIPE”

于 2021-03-18T15:46:12.480 回答