2

我正在使用 IPython 的 ipcluster 引擎进行简单的蒙特卡洛模拟练习。根据我定义函数的方式,我注意到执行时间存在巨大差异,我正在询问原因。以下是详细信息:

当我将任务定义如下时,它很快:

def sample(n):
    return (rand(n)**2 + rand(n)**2 <= 1).sum()

并行运行时:

from IPython.parallel import Client
rc = Client()
v = rc[:]
with v.sync_imports():
from numpy.random import rand
n = 1000000

timeit -r 1 -n 1 print 4.* sum(v.map_sync(sample, [n]*len(v))) / (n*len(v))

3.141712
1 loops, best of 1: 53.4 ms per loop

但是,如果我将功能更改为:

def sample(n):
    return sum(rand(n)**2 + rand(n)**2 <= 1)

我得到:
3.141232 1 个循环,最好的 1:每个循环 3.81 秒

...慢了 71 倍。这可能是什么原因?

4

1 回答 1

1

我不能太深入,但它较慢的原因是因为sum(<array>)是内置的 CPython sum 函数,而您<numpy array>.sum()使用的是 numpy sum 函数,它比内置的 python 版本快得多。

我想如果你替换为你会得到类似sum(<array>)的结果numpy.sum(<array>)

在此处查看 numpy sum 文档:http: //docs.scipy.org/doc/numpy/reference/generated/numpy.sum.html

于 2013-08-29T20:59:00.823 回答