我对 numpy 的numpy.apply_along_axis()
函数何时会胜过简单的 Python 循环感到困惑。例如,考虑具有许多行的矩阵的情况,并且您希望计算每一行的总和:
x = np.ones([100000, 3])
sums1 = np.array([np.sum(x[i,:]) for i in range(x.shape[0])])
sums2 = np.apply_along_axis(np.sum, 1, x)
在这里,我什至使用了一个内置的 numpy 函数,np.sum
但是计算sums1
(Python 循环)需要不到 400 毫秒,而计算sums2
(apply_along_axis
)需要超过 2000 毫秒(Windows 上的 NumPy 1.6.1)。通过进一步的比较,R 的 rowMeans 函数通常可以在不到 20 毫秒的时间内完成(我很确定它正在调用 C 代码),而类似的 R 函数apply()
可以在大约 600 毫秒内完成。