2

我正在尝试 Numba 来加速计算联合发生的最小条件概率的函数。

    import numpy as np
    from numba import double
    from numba.decorators import jit, autojit

    X = np.random.random((100,2))

    def cooccurance_probability(X):
        P = X.shape[1]      
        CS = np.sum(X, axis=0)                  #Column Sums
        D = np.empty((P, P), dtype=np.float)    #Return Matrix
        for i in range(P):
            for j in range(P):
                D[i, j] = (X[:,i] * X[:,j]).sum() / max(CS[i], CS[j])
        return D 

    cooccurance_probability_numba = autojit(cooccurance_probability)

但是我发现 和 的性能cooccurance_probability几乎cooccurance_probability_numba相同。

%timeit cooccurance_probability(X)
1 loops, best of 3: 302 ms per loop

%timeit cooccurance_probability_numba(X)
1 loops, best of 3: 307 ms per loop

为什么是这样?可能是由于元素操作的numpy元素吗?

我以以下为例: http: //nbviewer.ipython.org/github/ellisonbg/talk-sicm2-2013/blob/master/NumbaCython.ipynb

[注意:由于问题的对称性,我可以将执行时间减半——但这不是我主要关心的问题]

4

2 回答 2

3

我的猜测是,由于对 的调用,您正在访问对象层而不是生成本机代码sum,这意味着 Numba 不会显着加快速度。它只是不知道如何优化/翻译sum(此时)。此外,通常最好使用 Numba 将矢量化操作展开为显式循环。请注意,您链接到的 ipynb 仅调用np.sqrt我认为确实会翻译为机器代码的调用,并且它对元素而不是切片进行操作。我会尝试将内部循环中的总和扩展为元素上的显式附加循环,而不是采用切片并使用该sum方法。

我的经验是 Numba 有时可以创造奇迹,但它不会加速任意 python 代码。您需要了解限制以及它可以有效优化的内容。另请注意,由于 Numba 在这些版本之间进行了重大重构,v0.11 在这方面与 0.12 和 0.13 相比有些不同。

于 2014-04-04T05:14:02.197 回答
1

下面是一个使用 Josh 建议的解决方案,这是正确的。但是看起来 max() 在下面的实现中工作正常。如果有一个“安全” python / numpy 函数的列表,那就太好了。

注意:我将原始矩阵的维数降低到 100 x 200]

import numpy as np
from numba import double
from numba.decorators import jit, autojit

X = np.random.random((100,200))

def cooccurance_probability_explicit(X):
    C = X.shape[0]
    P = X.shape[1]      
    # - Column Sums - #
    CS = np.zeros((P,), dtype=np.float)
    for p in range(P):
        for c in range(C):
            CS[p] += X[c,p]
    D = np.empty((P, P), dtype=np.float)    #Return Matrix
    for i in range(P):
        for j in range(P):
            # - Compute Elemental Pairwise Sums over each Product Vector - #
            pws = 0
            for c in range(C):
                pws += (X[c,i] * X[c,j])
            D[i,j] = pws / max(CS[i], CS[j])
    return D 

cooccurance_probability_explicit_numba = autojit(cooccurance_probability_explicit)

%timeit结果:

%timeit cooccurance_probability(X)
10 loops, best of 3: 83 ms per loop


%timeit cooccurance_probability_explicit(X)
1 loops, best of 3: 2.55s per loop

%timeit cooccurance_probability_explicit_numba(X)
100 loops, best of 3: 7.72 ms per loop

结果的有趣之处在于,由于类型检查开销很大,python 执行的显式编写版本非常慢。但是通过 Numba 很神奇。(Numba 比使用 Numpy 的 python 解决方案快约 11.5 倍)。


更新:添加了用于比较的 Cython 函数(感谢 moarningsun:具有可变大小矩阵输入的 Cython 函数

%load_ext cythonmagic
%%cython
import numpy as np
cimport numpy as np

def cooccurance_probability_cy(double[:,:] X):
    cdef int C, P, i, j, k
    C = X.shape[0]
    P = X.shape[1]
    cdef double pws
    cdef double [:] CS = np.sum(X, axis=0)
    cdef double [:,:] D = np.empty((P,P), dtype=np.float)

    for i in range(P):
        for j in range(P):
            pws = 0.0
            for c in range(C):
                pws += (X[c, i] * X[c, j])
            D[i,j] = pws / max(CS[i], CS[j]) 
    return D

%timeit结果:

%timeit cooccurance_probability_cy(X)
100 loops, best of 3: 12 ms per loop
于 2014-04-04T23:43:09.927 回答