0

我想调用一个方法 getRecommendations,它只是将针对特定用户的建议腌制到文件中。我使用了一本有效的书中的代码。但是我看到只有一个核心可以工作,我希望我所有的核心都可以工作,因为这样会快得多。

这是方法。

def getRecommendations(prefs,person,similarity=sim_pearson):
    print "working on recommendation"
    totals={}
    simSums={}
    for other in prefs:
    # don't compare me to myself
        if other==person: continue
        sim=similarity(prefs,person,other)
        # ignore scores of zero or lower
        if sim<=0: continue
        for item in prefs[other]:
            # only score movies I haven't seen yet
            if item not in prefs[person] or prefs[person][item]==0:
                # Similarity * Score
                totals.setdefault(item,0)
                totals[item]+=prefs[other][item]*sim
                # Sum of similarities
                simSums.setdefault(item,0)
                simSums[item]+=sim
    # Create the normalized list
    rankings=[(total/simSums[item],item) for item,total in totals.items( )]
    # Return the sorted list
    rankings.sort( )
    rankings.reverse( )
    ranking_output = open("data/rankings/"+str(int(person))+".ranking.recommendations","wb")
    pickle.dump(rankings,ranking_output)
    return rankings

它被称为通过

for i in customerID: 
        print "working on ", int(i)
        #Make this working with multiple CPU's
        getRecommendations(pickle.load(open("data/critics.recommendations", "r")), int(i))

如您所见,我尝试向每位客户提出建议。后面会用到。

那么我怎样才能多处理这个方法呢?我没有通过阅读一些示例甚至文档来理解它

4

2 回答 2

0

您想要一些东西(大致未经测试),例如:

from multiprocessing import Pool
NUMBER_OF_PROCS = 5 # some number... not necessarily the number of cores due to I/O

pool = Pool(NUMBER_OF_PROCS)

for i in customerID:
    pool.apply_async(getRecommendations, [i])

pool.close()
pool.join()

(这是假设您只将 'i' 传递给 getRecommendations,因为 pickle.load 应该只执行一次)

于 2013-08-28T12:06:42.817 回答
0

詹姆斯给出的答案是正确的。我只是要补充一点,您需要通过以下方式导入多处理模块

from multiprocessing import Pool

而且,Pool(4) 意味着您要创建 4 个“工作”进程,它们将并行工作以执行您的任务。

于 2013-08-28T13:52:55.047 回答