3

我需要测量两个 n 维向量之间的距离。看来马氏距离在这里是一个不错的选择,所以我想尝试一下。

我的代码如下所示:

import numpy as np
import scipy.spatial.distance.mahalanobis

x = [19, 8, 0, 0, 2, 1, 0, 0, 18, 0, 1673, 9, 218]
y = [17, 6, 0, 0, 1, 2, 0, 0, 8, 0, 984, 9, 30]
scipy.spatial.distance.mahalanobis(x,y,np.linalg.inv(np.cov(x,y)))

但我收到此错误消息:

/usr/lib/python2.7/dist-packages/scipy/spatial/distance.pyc in mahalanobis(u, v, VI)
    498     v = np.asarray(v, order='c')
    499     VI = np.asarray(VI, order='c')
--> 500     return np.sqrt(np.dot(np.dot((u-v),VI),(u-v).T).sum())
    501 
    502 def chebyshev(u, v):

ValueError: matrices are not aligned

Scipy Doc 说,这VI是协方差矩阵的逆矩阵,我认为np.cov是协方差矩阵,np.linalg.inv是矩阵的逆矩阵......

但我知道这里有什么问题(矩阵未对齐):矩阵 VI 的尺寸错误(2x2 而不是 13x13)。所以可能的解决方案是这样做:

VI = np.linalg.inv(np.cov(np.vstack((x,y)).T))

但不幸的是 det ofnp.cov(np.vstack((x,y)).T)为 0,这意味着不存在逆矩阵。

那么当我什至无法计算协方差矩阵时,如何使用马氏距离测量?

4

2 回答 2

3

您确定 Mahalanobis 距离适合您的应用吗?根据维基百科,您需要一组点来生成协方差矩阵,而不仅仅是两个向量。然后你可以计算向量到集合中心的距离。

于 2013-06-19T11:08:39.920 回答
1

您没有用于计算协方差的样本集。您可能只需要此处的欧几里得距离 ( np.linalg.norm(x-y))。您正在努力实现的目标是什么?

于 2013-06-19T11:15:49.673 回答