我正在编写一些操作 3D 三角形网格的代码。导入网格数据后,我需要“统一”空间中同一点的顶点。
我一直假设 numpy 数组将是存储和操作数据的最快方式,但我似乎无法找到一种快速构建顶点列表同时避免添加重复条目的方法。
因此,要测试方法,创建一个 3x30000 数组,其中包含 10000 个唯一行:
import numpy as np
points = np.random.random((10000,3))
raw_data = np.concatenate((points,points,points))
np.random.shuffle(raw_data)
这可以很好地近似网格数据,每个点都作为一个小平面顶点出现 3 次。在统一的同时,我需要建立一个唯一顶点列表;如果一个点已经在列表中,则必须存储对它的引用。
到目前为止,我使用 numpy 所能想到的最好的方法如下:
def unify(raw_data):
# first point must be new
unified_verts = np.zeros((1,3),dtype=np.float64)
unified_verts[0] = raw_data[0]
ref_list = [0]
for i in range(1,len(raw_data)):
point = raw_data[i]
index_array = np.where(np.all(point==unified_verts,axis=1))[0]
# point not in array yet
if len(index_array) == 0:
point = np.expand_dims(point,0)
unified_verts = np.concatenate((unified_verts,point))
ref_list.append(len(unified_verts)-1)
# point already exists
else:
ref_list.append(index_array[0])
return unified_verts, ref_list
使用 cProfile 进行测试:
import cProfile
cProfile.run("unify(raw_data)")
在我的机器上,它在 5.275 秒内运行。我虽然使用 Cython 来加速它,但从我读过的内容来看,Cython 通常不会比 numpy 方法运行得快得多。关于如何更有效地做到这一点的任何建议?