3

参考论文Bundle Min Hashing for Logo Recognition:

假设我们有包 {2,5,18,444,678} 和 {2,5,79,368,841},词汇量为 1M。如果我们每个包只有 1 个草图,那么我们是否只需要 1 个散列函数,它将 1M 整数确定性地散列为 [0,1] 中均匀分布的值。每次调用的散列函数必须有固定的种子。对于 4 幅草图,我们只需要具有 4 个种子的相同散列函数。想法是否正确?

或者我们可以从集合(捆绑)中随机选择一个数字作为最小哈希词,因为它们代表集合的随机排列?

论文中需要实现散列函数的任何参考?

MurmurHash3 可以完成这项工作吗?

4

0 回答 0