Count min sketch 使用不同的散列函数将流中的元素映射到散列函数。如何从草图映射回来以找到最常见的项目?考虑到已经传递了足够多的元素(数百万)并且我们不知道这些元素。
问问题
1642 次
1 回答
2
首先,为了存储数据,CMS 使用成对独立的散列函数来映射其结构中的元素(将其视为一个表)。其次,不支持按原样进行反向处理,即从表格中区分CMS中的不同元素。
使用单独的元素作为查询,您可以使用相同的哈希函数系列(点查询)检索它们在流中的估计计数。
为了检索最频繁的项目/项目,应使用额外的数据结构,例如堆。Appart 从 CMS 论文中可以找到关于您的问题的快速有用的演示:http: //theory.stanford.edu/~tim/s15/l/l2.pdf
于 2016-12-05T09:14:20.983 回答