python - Python 子进程 Popen.communicate() 等价于 Popen.stdout.read()？

Question

非常具体的问题（我希望）：以下三个代码有什么区别？

（我希望只是第一个不会等待子进程完成，而第二个和第三个会等待。但我需要确定这是唯一的区别......）

我也欢迎其他评论/建议（尽管我已经很清楚shell=True危险和跨平台限制）

请注意，我已经阅读了Python 子进程交互，为什么我的进程可以使用 Popen.communicate，而不是 Popen.stdout.read()？并且我不想/不需要之后与程序交互。

另请注意，我已经阅读了 Python Popen.communicate() 内存限制的替代方案？但我并没有真正明白...

最后，请注意，我知道当一个缓冲区使用一种方法填充一个输出时，某处存在死锁的风险，但我在互联网上寻找明确的解释时迷路了......

第一个代码：

from subprocess import Popen, PIPE

def exe_f(command='ls -l', shell=True):
    """Function to execute a command and return stuff"""

    process = Popen(command, shell=shell, stdout=PIPE, stderr=PIPE)

    stdout = process.stdout.read()
    stderr = process.stderr.read()

    return process, stderr, stdout

第二个代码：

from subprocess import Popen, PIPE
from subprocess import communicate

def exe_f(command='ls -l', shell=True):
    """Function to execute a command and return stuff"""

    process = Popen(command, shell=shell, stdout=PIPE, stderr=PIPE)

    (stdout, stderr) = process.communicate()

    return process, stderr, stdout

第三个代码：

from subprocess import Popen, PIPE
from subprocess import wait

def exe_f(command='ls -l', shell=True):
    """Function to execute a command and return stuff"""

    process = Popen(command, shell=shell, stdout=PIPE, stderr=PIPE)

    code   = process.wait()
    stdout = process.stdout.read()
    stderr = process.stderr.read()

    return process, stderr, stdout

谢谢。

score 38 · Accepted Answer

如果您查看的来源subprocess.communicate()，它显示了一个完美的差异示例：

def communicate(self, input=None):
    ...
    # Optimization: If we are only using one pipe, or no pipe at
    # all, using select() or threads is unnecessary.
    if [self.stdin, self.stdout, self.stderr].count(None) >= 2:
        stdout = None
        stderr = None
        if self.stdin:
            if input:
                self.stdin.write(input)
            self.stdin.close()
        elif self.stdout:
            stdout = self.stdout.read()
            self.stdout.close()
        elif self.stderr:
            stderr = self.stderr.read()
            self.stderr.close()
        self.wait()
        return (stdout, stderr)

    return self._communicate(input)

您可以看到communicate确实使用了对 and 的 read 调用stdout，stderr并且还调用了wait()。这只是操作顺序的问题。在您的情况下，因为您同时使用PIPE标准输出和标准错误，它进入_communicate()：

def _communicate(self, input):
    stdout = None # Return
    stderr = None # Return

    if self.stdout:
        stdout = []
        stdout_thread = threading.Thread(target=self._readerthread,
                                         args=(self.stdout, stdout))
        stdout_thread.setDaemon(True)
        stdout_thread.start()
    if self.stderr:
        stderr = []
        stderr_thread = threading.Thread(target=self._readerthread,
                                         args=(self.stderr, stderr))
        stderr_thread.setDaemon(True)
        stderr_thread.start()

    if self.stdin:
        if input is not None:
            self.stdin.write(input)
        self.stdin.close()

    if self.stdout:
        stdout_thread.join()
    if self.stderr:
        stderr_thread.join()

    # All data exchanged.  Translate lists into strings.
    if stdout is not None:
        stdout = stdout[0]
    if stderr is not None:
        stderr = stderr[0]

    # Translate newlines, if requested.  We cannot let the file
    # object do the translation: It is based on stdio, which is
    # impossible to combine with select (unless forcing no
    # buffering).
    if self.universal_newlines and hasattr(file, 'newlines'):
        if stdout:
            stdout = self._translate_newlines(stdout)
        if stderr:
            stderr = self._translate_newlines(stderr)

    self.wait()
    return (stdout, stderr)

这使用线程一次从多个流中读取。然后它wait()在最后调用。

所以总结一下：

此示例一次从一个流中读取，并且不等待它完成该过程。
此示例通过内部线程同时从两个流中读取，并等待它完成该过程。
此示例等待进程完成，然后一次读取一个流。正如您所提到的，如果流中写入的内容过多，则可能会出现死锁。

此外，您在第二个和第三个示例中不需要这两个导入语句：

from subprocess import communicate
from subprocess import wait

它们都是Popen对象的方法。

python - Python 子进程 Popen.communicate() 等价于 Popen.stdout.read()？

1 回答 1

Related

Reference