我正在尝试使用和加速花式索引来“加入”两个数组并在结果轴之一上求和。
像这样的东西:
$ ipython
In [1]: import numpy as np
In [2]: ne, ds = 12, 6
In [3]: i = np.random.randn(ne, ds).astype('float32')
In [4]: t = np.random.randint(0, ds, size=(1e5, ne)).astype('uint8')
In [5]: %timeit i[np.arange(ne), t].sum(-1)
10 loops, best of 3: 44 ms per loop
有没有一种简单的方法来加速语句In [5]
?我应该使用 OpenMP 和类似scipy.weave
orCython
的东西prange
吗?