python - Python多处理 - 为完成的进程分配一个新函数？

Question

我有一个包含 800 个图像文件的列表，我想并行处理这些文件。假设我将他们的名字存储在一个列表中：

lis_fnames = ['im1.jpg','im2.jpg',...']

然后我导入多处理模块并从中导入 Pool。我给每个线程一个名为“run_cli”的函数，它接受文件名。

截至目前，我运行以下代码：

def run_pool():
    pool = Pool(processes=4)
    pool.map(run_cli, ['im1.jpg','im2.jpg','im3.jpg','im4.jpg'])

并在迭代完成后手动更改文件名。我的问题是：

Q) 给定四个进程，如果一个进程已完成，我如何自动为其提供“run_cli”函数和另一个文件名（来自 lis_fnames 列表）供它分析，而不必等待所有四个进程都完成，然后再次手动运行？

score 2 · Accepted Answer

你应该把它留给游泳池。无需手动将您的迭代拆分为合适的块。只需将其全部映射，只要您的列表中还有物品，Pool 就会继续为您的员工提供更多工作。

这是一个简单但有效的示例。它还显示了处理结果的两种可能方式。它执行回调并解析结果对象。当然，您只会做其中之一 - 如果您不关心员工的返回值，则不做。

import multiprocessing    
from time import sleep
import random

def completed(x):
    print("Done {}".format(x))

def worker(x):
    sleep(x)
    print("Worker completed {}".format(x))
    return(x)

p = multiprocessing.Pool(processes=4)

tasks = [random.randint(0,5) for _ in range(0,20)]

results = p.map_async(worker, tasks, callback=completed)

p.close()
p.join()
for r in results.get():
    print(r)

这会生成一个“任务”列表，在这种情况下只是一个随机数列表。Worker 通过休眠作为参数发送的秒数来模拟工作。你可以看到工人完成，最后当所有工人都完成后，你会得到“结果”。

始终有四个并行工作人员处于活动状态，但任务列表超出了此范围。池能够解决这个问题。

python - Python多处理 - 为完成的进程分配一个新函数？

1 回答 1

Related

Reference