1

我有一个在过去 3 个月内一直正常工作的脚本。服务器上周一宕机了,从那以后我的脚本就停止了工作。脚本挂在coords = p.communicate()[0].split().

这是脚本的一部分:

class SelectByLatLon(GridSelector):
def __init__(self, from_lat, to_lat, from_lon, to_lon):
self.from_lat = from_lat
self.to_lat = to_lat
self.from_lon = from_lon
self.to_lon = to_lon

def get_selection(self, file):
p = subprocess.Popen(
        [
    os.path.join(module_root, 'bin/points_from_latlon.tcl'), 
    file, 
    str(self.from_lat), str(self.to_lat), str(self.from_lon), str(self.to_lon)
    ],
        stdout = subprocess.PIPE
    )
    coords = p.communicate()[0].split()
    return ZGridSelection(int(coords[0]), int(coords[1]), int(coords[2]), int(coords[3]))   

当我在另一台服务器上运行脚本时,一切正常。我可以用别的东西代替p.communicate()[0].split()吗?

4

1 回答 1

1

您之前可能在没有守护程序的情况下运行您的服务器,即,您有功能性的标准输入、标准输出、标准错误流。要修复,您可以将流重定向到子进程的 DEVNULL:

import os
from subprocess import Popen, PIPE

DEVNULL = os.open(os.devnull, os.O_RDWR)
p = Popen(tcl_cmd, stdin=DEVNULL, stdout=PIPE, stderr=DEVNULL, close_fds=True)
os.close(DEVNULL)

.communicate()即使tcl_cmd已经退出,也可能在标准输出上等待 EOF:tcl 脚本可能已经产生了一个继承标准流并且比其父进程寿命更长的子进程。

如果您知道退出后不需要任何标准输出,tcl_cmd那么您可以在检测到tcl_cmd完成时终止整个进程树。

您可能需要start_new_session=True模拟才能杀死整个进程树:

import os
import signal
from threading import Timer

def kill_tree_on_exit(p):
    p.wait() # wait for tcl_cmd to exit
    os.killpg(p.pid, signal.SIGTERM)

t = Timer(0, kill_tree_on_exit, [p])
t.start()
coords = p.communicate()[0].split()
t.cancel()

请参阅如何终止使用 shell=True 启动的 python 子进程

于 2014-03-08T08:26:09.050 回答