6

我的问题是以最有效的方式提取 N Poisson 随机值 ( RV),每个值都有不同的 mean/rate Lam。基本上是size(RV) == size(Lam).

这是一个幼稚(非常慢)的实现:

import numpy as NP

def multi_rate_poisson(Lam):
    rv = NP.zeros(NP.size(Lam))
    for i,lam in enumerate(Lam):
        rv[i] = NP.random.poisson(lam=lam, size=1)
    return rv

那,在我的笔记本电脑上,有 1e6 个样本给出:

Lam = NP.random.rand(1e6) + 1
timeit multi_poisson(Lam)
1 loops, best of 3: 4.82 s per loop

是否有可能从中改进?

4

1 回答 1

2

尽管文档字符串没有记录此功能,但来源表明可以将数组传递给 numpy.random.poisson 函数。

>>> import numpy
>>> # 1 dimension array of 1M random var's uniformly distributed between 1 and 2
>>> numpyarray = numpy.random.rand(1e6) + 1 
>>> # pass to poisson
>>> poissonarray = numpy.random.poisson(lam=numpyarray)
>>> poissonarray
array([4, 2, 3, ..., 1, 0, 0])

泊松随机变量返回 1的离散倍数,并在 lambda 超过 1 时近似为钟形曲线。

>>> import matplotlib.pyplot
>>> count, bins, ignored = matplotlib.pyplot.hist(
            numpy.random.poisson(
                    lam=numpy.random.rand(1e6) + 10), 
                    14, normed=True)
>>> matplotlib.pyplot.show()

这种将数组传递给泊松生成器的方法似乎非常有效。

>>> timeit.Timer("numpy.random.poisson(lam=numpy.random.rand(1e6) + 1)",
                 'import numpy').repeat(3,1)
[0.13525915145874023, 0.12136101722717285, 0.12127304077148438]
于 2013-09-17T05:40:47.950 回答