0

我得到了一个公式来计算两个长度为 n 的实向量 a 和 b 的 Jaccard 系数。

在此处输入图像描述

这个公式正确吗?如果我计算向量 {5, 3, 1, 0, 3} 和 {7, 1, 3, 2, 1} 的系数,我会得到一个负数,我认为该负数不允许用于度量)。

(5*7 + 3*1 + 1*3 + 0*2 + 3*1) = 44

44 / (12+ 14 - 44) = -22/9

4

1 回答 1

1

正如 Jaccard 最初定义的那样,相似系数是交集的大小除以并集的大小。由于两者都是大小,因此显然不可能得出负面结果。

您在问题中显示的内容有点像位向量的 Jaccard 相似度。但是,为此,您需要将分母左侧的每个术语平方,通常显示如下:

在此处输入图像描述

我怀疑缺乏平方是导致您目前看到的问题的原因——没有它,我们通常可以预期分母为负数。更具体地说,对于一项,(A + B) - (A * B)要为正,A 或 B 中的至少一项必须小于 1。

于 2015-05-26T20:43:02.600 回答