所以我最近才知道这些,但据我了解,计数布隆过滤器与计数分钟草图非常相似。不同之处在于前者对所有散列函数使用单个数组,而后者对每个散列函数使用一个数组。
如果为每个散列函数使用单独的数组将导致更少的冲突并减少误报,那么为什么没有这样实现计数布隆过滤器?
所以我最近才知道这些,但据我了解,计数布隆过滤器与计数分钟草图非常相似。不同之处在于前者对所有散列函数使用单个数组,而后者对每个散列函数使用一个数组。
如果为每个散列函数使用单独的数组将导致更少的冲突并减少误报,那么为什么没有这样实现计数布隆过滤器?
尽管两者都是节省空间的概率数据结构,BloomFilter
并且Count-min-sketch
可以解决不同的用例。