3

我有两个 2D 点集AB. 我想为 中A的每个点找到第一个最近的邻居B。但是,我正在处理不确定的点(即一个点有一个均值(2D 向量)和一个 2*2 协方差矩阵)。

因此,我想使用马氏距离,但在scikit-learn(例如)中,我不能为每个点传递协方差矩阵,因为它需要一个协方差矩阵。

目前,仅考虑平均位置(即我的二维正态分布的平均值),我有:

nearest_neighbors = NearestNeighbors(n_neighbors=1, metric='l2').fit(A)
distance, indices = nearest_neighbors.kneighbors(B)

使用我的不确定点,而不是使用 L2 范数作为距离,我宁愿计算(在点ainAbB 中的点之间,它们的马氏距离:

d(a, b) = sqrt( transpose(mu_a-mu_b) * C * (mu_a-mu_b))

在哪里C = inv(cov_a + cov_b)

其中mu_a(resp mu_b) 和cov_a(resp. cov_b) 是不确定点a(resp. b) 的 2D 均值和 2*2 协方差矩阵。

4

2 回答 2

0

我最终使用了自定义距离:

def my_mahalanobis_distance(x, y):
    '''
    x: array of shape (4,) x[0]: mu_x_1, x[1]: mu_x_2, 
                            x[2]: cov_x_11, x[3]: cov_x_22
    y: array of shape (4,) y[0]: mu_ y_1, y[1]: mu_y_2,
                            y[2]: cov_y_11, y[3]: cov_y_22 
    '''     



    return sp.spatial.distance.mahalanobis(x[:2], y[:2], 
                                           np.linalg.inv(np.diag(x[2:]) 
                                           + np.diag(y[2:])))

因此一个点有4个特征:

  • xy坐标
  • xy方差(在我的情况下协方差矩阵是对角线)
于 2017-01-09T09:06:39.737 回答
0

您可以使用自己的距离函数简单地使用列表推导来实现 KNN 解决方案。这是一个使用 OpenCV 库中内置的 Mahalanobis 距离实现的示例

import numpy as np
import cv2

np_gallery=np.array(gallery)
np_query=np.array(query)

K=12

ids=[]

def insertionsort(comp_list):
    for i in range( 1, len(comp_list)):
    tmp = comp_list[i]
    k = min(i,K)
    while k > 0 and tmp[1] < comp_list[k - 1][1]:
        comp_list[k] = comp_list[k - 1]
        k -= 1
    comp_list[k] = tmp

def search():
    for q in np_query:
        c = [(i,cv2.Mahalanobis(q, x, icovar)) for i, x in enumerate(np_gallery)]
        insertionsort(c)
        ids.append(map(lambda tup: tup[0], c[0:K]))

或者

def search():
    for q in np_query:
        c = [(i,cv2.Mahalanobis(q, x, icovar)) for i, x in enumerate(np_gallery)]
        ids.append(map(lambda tup: tup[0], sorted(c, key=lambda tup: tup[1])[0:K]))

在第一种情况下,我使用考虑到参数 K 的插入排序的变体。当 N >> K 时效率更高

于 2017-01-06T21:23:59.820 回答