我正在阅读这个问题:
但是后来我发现计算余弦相似度的公式如下: Cos(v1, v2) = Cos(theta) = (hamming distance/signature length) * pi = ((h/b) * pi )
这意味着如果向量完全相似,则汉明距离为零,余弦值为 1。但是当向量完全不相似时,汉明距离将等于签名长度,因此我们有 cos( pi) 这将导致 -1。相似度不应该总是在 0 和 1 之间吗?
我正在阅读这个问题:
但是后来我发现计算余弦相似度的公式如下: Cos(v1, v2) = Cos(theta) = (hamming distance/signature length) * pi = ((h/b) * pi )
这意味着如果向量完全相似,则汉明距离为零,余弦值为 1。但是当向量完全不相似时,汉明距离将等于签名长度,因此我们有 cos( pi) 这将导致 -1。相似度不应该总是在 0 和 1 之间吗?