17

我有这样的场景:

for each in content :
     pdf_output,job_id=createpdf(each)
     if pdf_output : 
        pdf_output = pdf_output + pdf_output

我正在尝试并行化整个过程。像这样的东西

 jobs=[]
    for each in content : 
       jobs.append(multiprocessing.Process(target=self.createpdf, args=(content)))

    for each in jobs :
         jobs.start()
    for each in jobs :
         jobs.join()

我如何明智地完成任务

if pdf_output : 
            pdf_output = pdf_output + pdf_output

对于每项工作?如何检索 createpdf 发送的 2 个 retun 值并对其进行处理?我认为 multiprocessing.Queue 是一个线索,但我该如何实现呢?

4

1 回答 1

37

对于这样一个简单的任务,您不需要队列。我建议使用游泳池。该Pool.map方法可以将一个函数并行应用于一系列值:

import multiprocessing
def createpdf(data):
    return ("This is my pdf data: %s\n" % data, 0)


data = [ "My data", "includes", "strings and", "numbers like", 42, "and", 3.14]
number_of_processes = 5
results = multiprocessing.Pool(number_of_processes).map(createpdf, data)
outputs = [result[0] for result in results]
pdfoutput = "".join(outputs)
于 2012-05-29T12:55:41.650 回答