系统信息:
Linux Ubuntu
Docker
Python 3.6.8
我正在为医学图像分割进行动态数据增强。受faustomilletari/VNetline 158~161
的启发,数据增强的代码示例如下:
trainQueue = Queue(queue_size) # store patches
tr_dataPrep = [None] * nProc
for proc in range(nProc):
tr_dataPrep[proc] = Process(target=data_aug_function, args=(train_files, trainQueue, patch_size))
tr_dataPrep[proc].daemon = True
tr_dataPrep[proc].start()
上面的代码在一台服务器上运行良好,现在不可用,但在另一台服务器上失败,一段时间后出现大量僵尸子进程,训练进程无限期地挂在那里。
似乎有些子进程被系统杀死了,但我们不知道为什么。