10

因此,假设我在 A 中有 10,000 个点,在 B 中有 10,000 个点,并且想为每个 B 点找出 A 中最近的点。

目前,我只是遍历 B 和 A 中的每个点,以找出距离最近的点。IE。

B = [(.5, 1, 1), (1, .1, 1), (1, 1, .2)]
A = [(1, 1, .3), (1, 0, 1), (.4, 1, 1)]
C = {}
for bp in B:
   closestDist = -1
   for ap in A:
      dist = sum(((bp[0]-ap[0])**2, (bp[1]-ap[1])**2, (bp[2]-ap[2])**2))
      if(closestDist > dist or closestDist == -1):
         C[bp] = ap
         closestDist = dist
print C

但是,我确信有一种更快的方法可以做到这一点......有什么想法吗?

4

3 回答 3

4

在这种情况下,我通常使用kd-tree 。

有一个使用 SWIG 包装并与易于使用的BioPython 捆绑的 C++ 实现。

于 2010-04-14T21:37:49.550 回答
1

您可以使用一些空间查找结构。一个简单的选项是八叉树;更高级的包括BSP 树

于 2010-04-14T21:33:21.240 回答
1

你可以使用 numpy 广播。例如,

from numpy import *
import numpy as np

a=array(A)
b=array(B)
#using looping
for i in b:
    print sum((a-i)**2,1).argmin()

将打印 2,1,0,它们分别是 a 中最接近 B 的 1,2,3 行的行。

否则,您可以使用广播:

z = sum((a[:,:, np.newaxis] - b)**2,1)
z.argmin(1) # gives array([2, 1, 0])

我希望这会有所帮助。

于 2010-04-15T13:52:25.393 回答