0

假设我有一个X具有 10 个特征的对象:[0, 0, 0, 0, 0, 0, 0, 0, 0, 0].

然后,我还有两个对象:

  • A : [2, 2, 2, 2, 2, 2, 2, 2, 2, 2]
  • B : [0, 0, 0, 0, 0, 0, 0, 0, 0, 20]

我需要知道哪个来自AB“更接近” X

我在“相似性”背后的想法是:

最好所有功能都几乎相同,而不是许多功能非常接近但有些非常不同。

根据这个“定义”,A似乎更X接近于B

然而,算术平均值似乎不是实现这个想法的正确工具,因为它对于两个对象都是 2。

请问这种问题有特定的指标吗?

4

3 回答 3

1

欧几里得距离呢?

在您的情况下,A 和 X 之间的欧几里得距离是 40 的平方根(大约 = 6.32),B 和 X 之间的距离是 20,因此 A 确实更类似于该度量。

于 2015-10-17T17:47:00.077 回答
1

您还可以考虑使用余弦相似度。余弦相似度测量向量相对于原点的相似度,而欧几里德距离测量沿向量的特定兴趣点之间的距离。

是一篇关于何时选择另一个的好文章。

另一个常见的度量是 Jaccard 相似度。 是一篇比较余弦与 Jaccard 相似度的文章。

于 2015-10-18T22:26:50.023 回答
0

在特征非常不相似并且可能变化不同的情况下,必须对欧几里得距离进行归一化。

这可以使用涉及特征方差的马氏距离来完成。

马氏距离

另外,请参阅此问题

于 2015-10-17T18:39:09.643 回答