python - 纯 Python 比 Numpy 快？我可以让这个 numpy 代码更快吗？

Question

我需要从特定的面/顶点列表中计算最小值、最大值和平均值。我尝试使用 Numpy 优化这种计算，但没有成功。

这是我的测试用例：

#!/usr/bin/python
# -*- coding: iso-8859-15 -*-
'''
Module Started 22 févr. 2013
@note: test case comparaison numpy vs python
@author: Python4D/damien
'''

import numpy as np
import time


def Fnumpy(vertices):
  np_vertices=np.array(vertices)
  _x=np_vertices[:,:,0]
  _y=np_vertices[:,:,1]
  _z=np_vertices[:,:,2]
  _min=[np.min(_x),np.min(_y),np.min(_z)]
  _max=[np.max(_x),np.max(_y),np.max(_z)]
  _mean=[np.mean(_x),np.mean(_y),np.mean(_z)]
  return _mean,_max,_min

def Fpython(vertices):
  list_x=[item[0] for sublist in vertices for item in sublist]
  list_y=[item[1] for sublist in vertices for item in sublist]
  list_z=[item[2] for sublist in vertices for item in sublist]
  taille=len(list_x)
  _mean=[sum(list_x)/taille,sum(list_y)/taille,sum(list_z)/taille]
  _max=[max(list_x),max(list_y),max(list_z)]
  _min=[min(list_x),min(list_y),min(list_z)]    
  return _mean,_max,_min

if __name__=="__main__":
  vertices=[[[1.1,2.2,3.3,4.4]]*4]*1000000
  _t=time.clock()
  print ">>NUMPY >>{} for {}s.".format(Fnumpy(vertices),time.clock()-_t)
  _t=time.clock()
  print ">>PYTHON>>{} for {}s.".format(Fpython(vertices),time.clock()-_t)

结果是：

麻木：

（[1.1000000000452519,2.20000000009038,3.300000000000000001]，3.2999999999998]，2.2999999999998]，3.2999999999998]，2.2000000000000001，2.299999999999998]），适用于27.327068618S。

Python：

([1.100000000045252, 2.200000000090504, 3.3000000001880174], [1.1, 2.2, 3.3], [1.1, 2.2, 3.3]) 为1.81366938593s。

纯 Python 比 Numpy 快 15 倍！

score 10 · Accepted Answer

你的速度较慢的原因Fnumpy是它包含一个额外的步骤Fpython：在内存中创建一个 numpy 数组。如果您将线移到定时部分np_verticies=np.array(verticies)之外，Fnumpy您的结果将非常不同：

>>NUMPY >>([1.1000000000452519, 2.2000000000905038, 3.3000000001880174], [1.1000000000000001, 2.2000000000000002, 3.2999999999999998], [1.1000000000000001, 2.2000000000000002, 3.2999999999999998]) for 0.500802s.
>>PYTHON>>([1.100000000045252, 2.200000000090504, 3.3000000001880174], [1.1, 2.2, 3.3], [1.1, 2.2, 3.3]) for 2.182239s.

您还可以通过在创建 numpy 时向其提供数据类型提示来显着加快分配步骤。如果你告诉 Numpy 你有一个浮点数组，那么即使你将np.array()调用留在计时循环中，它也会击败纯 python 版本。

如果我更改np_vertices=np.array(vertices)为np_vertices=np.array(vertices, dtype=np.float_)并保留它Fnumpy，即使它必须做更多的工作，该Fnumpy版本也会击败：Fpython

>>NUMPY >>([1.1000000000452519, 2.2000000000905038, 3.3000000001880174], [1.1000000000000001, 2.2000000000000002, 3.2999999999999998], [1.1000000000000001, 2.2000000000000002, 3.2999999999999998]) for 1.586066s.
>>PYTHON>>([1.100000000045252, 2.200000000090504, 3.3000000001880174], [1.1, 2.2, 3.3], [1.1, 2.2, 3.3]) for 2.196787s.

score 2 · Accepted Answer

正如其他人已经指出的那样，您的问题是从列表到数组的转换。通过为此使用适当的numpy函数，您将击败 Python。我修改了你程序的主要部分：

if __name__=="__main__":
  _t = time.clock()
  vertices_np = np.resize(np.array([ 1.1, 2.2, 3.3, 4.4 ], dtype=np.float64), 
                          (1000000, 4, 4))
  print "Creating numpy vertices: {}".format(time.clock() - _t)
  _t = time.clock()
  vertices=[[[1.1,2.2,3.3,4.4]]*4]*1000000
  print "Creating python vertices: {}".format(time.clock() - _t)
  _t=time.clock()
  print ">>NUMPY >>{} for {}s.".format(Fnumpy(vertices_np),time.clock()-_t)
  _t=time.clock()
  print ">>PYTHON>>{} for {}s.".format(Fpython(vertices),time.clock()-_t)

在我的机器上运行带有修改后的主要部分的代码：

Creating numpy vertices: 0.6
Creating python vertices: 0.01
>>NUMPY >>([1.1000000000452519, 2.2000000000905038, 3.3000000001880174], 
[1.1000000000000001, 2.2000000000000002, 3.2999999999999998], [1.1000000000000001, 
2.2000000000000002, 3.2999999999999998]) for 0.5s.
>>PYTHON>>([1.100000000045252, 2.200000000090504, 3.3000000001880174], [1.1, 2.2, 3.3], 
[1.1, 2.2, 3.3]) for 1.91s.

尽管使用 Numpy 工具创建数组的时间仍然更长一些，因为使用 python 的列表乘法运算符创建嵌套列表（0.6s 对 0.01s），您获得了大约 ca 的因子。4 用于代码的运行时相关部分。如果我替换该行：

np_vertices=np.array(vertices)

和

np_vertices = np.asarray(vertices)

为了避免复制一个大数组，我的机器上 numpy 函数的运行时间甚至下降到 0.37s，比纯 python 版本快 5 倍以上。

在您的真实代码中，如果您事先知道顶点的数量，您可以通过预先分配适当的数组np.empty()，然后用适当的数据填充它，并将其传递给函数的 numpy 版本。

python - 纯 Python 比 Numpy 快？我可以让这个 numpy 代码更快吗？

2 回答 2

Related

Reference