0

假设我们有两个集合的 minhash 签名,我们想要计算两个集合的 Jaccard 相似度。我们有:

-> S1 S2

h1 0 1

h2 1 2

h3 2 0

h4 3 3

S1 和 S2 具有相同的签名,但顺序不同。Jaccard 相似度是 1/8 还是 1(大约)?

4

1 回答 1

0

这些是不同的哈希函数,因此h2(S1) == h1(S2)没有任何意义。比较不同散列的值是没有意义的。所以直接回答 - 这里的相似性是 0(没有冲突),所以不是 1/8 也不是 1。

于 2016-02-20T19:17:34.493 回答