假设我们有两个集合的 minhash 签名,我们想要计算两个集合的 Jaccard 相似度。我们有:
-> S1 S2
h1 0 1
h2 1 2
h3 2 0
h4 3 3
S1 和 S2 具有相同的签名,但顺序不同。Jaccard 相似度是 1/8 还是 1(大约)?
假设我们有两个集合的 minhash 签名,我们想要计算两个集合的 Jaccard 相似度。我们有:
-> S1 S2
h1 0 1
h2 1 2
h3 2 0
h4 3 3
S1 和 S2 具有相同的签名,但顺序不同。Jaccard 相似度是 1/8 还是 1(大约)?