3

我正在尝试使用 psycopg 和多处理插入和更新几百万行。根据http://initd.org/psycopg/docs/usage.html#thread-and-process-safety中的文档,每个孩子都有自己的数据库连接。

但在行刑过程中,只有一个孩子逃跑,其他孩子变成了僵尸。脚本本身非常简单,这里是相同的修剪版本,

import os
import psycopg2

from multiprocessing import Process


def _target(args):
    # Each forked process will have its own connection
    # http://initd.org/psycopg/docs/usage.html#thread-and-process-safety
    conn = get_db_connection()

    # Stuff seems to execute till this point in all the children
    print os.getpid(), os.getppid()

    # Do some updates here. After this only one child is active and running
    # Others become Zombies after a while.


if __name__ == '__main__':
    args = "Foo"
    for i in xrange(3):
        p = Process(target=_target, args=(args,))
        p.start()

我还通过窥视检查了表是否具有升级锁pg_locks,但看起来情况并非如此。我错过了一些明显的东西吗?

4

1 回答 1

0

您的进程成为僵尸,因为有作业已完成但进程未加入。我用这个单一的测试重现了你的问题(我添加了睡眠来模拟长时间的工作):

import os
import time
from multiprocessing import Process

def _target(args):
    print os.getpid(), os.getppid()
    time.sleep(2)
    print os.getpid(), "will stop"

if __name__ == '__main__':
    args = "Foo"
    for i in xrange(3):
        p = Process(target=_target, args=(args,))
        p.start()
    import time
    time.sleep(10)

执行此操作时,在 3 个进程打印它们将停止后,它们将进入 ps 视图(它们不再移动,但并没有真正死去,因为父亲仍然持有它们)。

如果我用这个替换主要部分,我就没有僵尸了:

if __name__ == '__main__':
    args = "Foo"
    processes = []
    for i in xrange(3):
        p = Process(target=_target, args=(args,))
        processes.append(p)
        p.start()
    for p in processes:
        p.join()
    import time
    time.sleep(10)
于 2011-04-28T07:36:36.073 回答