0

所以Count-Min Sketch的重点是根据提供的哈希函数的结果更新某些计数器。但是,这些计数器在内存中是有限的,并且在运行相当长的一段时间后,它们可能会溢出,从 MAX 值下降到 MIN 值(就像整数一样)。假设我需要的是草图中最常见的 N 个值,除了每隔一段时间重新启动草图之外,有没有办法避免这种情况?

4

1 回答 1

1

如果这让您担心,请使用适当大小的整数。

一个 8 字节(long long)无符号整数的最大值为 18,446,744,073,709,551,615。这应该足够了。

编辑

假设我需要的是草图中最常见的 N 个值,除了每隔一段时间重新启动草图之外,有没有办法避免这种情况?

也许您可以根据需要调整水库采样

于 2018-03-07T19:56:01.873 回答