我的集合中的元素数量超过十亿 2 30。我打算计算集合中每个元素的出现次数。为此,我想使用 count-min 草图。请建议如何选择散列函数。我的申请最多可以容忍5%的误报率。
问问题
491 次
1 回答
0
Count-Min Sketch 需要 2-wise 独立哈希函数,但在实践中,我强烈推荐MurmurHash。它快速而强大,非常适合 Count-Min Sketch。
于 2015-05-29T06:51:15.730 回答