1

系统信息:

Linux Ubuntu
Docker
Python 3.6.8

我正在为医学图像分割进行动态数据增强。受faustomilletari/VNetline 158~161的启发,数据增强的代码示例如下:

trainQueue = Queue(queue_size) # store patches
tr_dataPrep = [None] * nProc
for proc in range(nProc):
    tr_dataPrep[proc] = Process(target=data_aug_function, args=(train_files, trainQueue, patch_size))
    tr_dataPrep[proc].daemon = True
    tr_dataPrep[proc].start()

上面的代码在一台服务器上运行良好,现在不可用,但在另一台服务器上失败,一段时间后出现大量僵尸子进程,训练进程无限期地挂在那里。

似乎有些子进程被系统杀死了,但我们不知道为什么。

4

0 回答 0