我试图理解这个草图,但无法理解。如果我错了,请纠正我,但基本上,假设我有一个文本数据..单词..我有一个散列函数..它需要一个单词并创建一个整数散列,然后我将该散列转换为二进制位向量?对.. 然后我跟踪我从左边看到的第一个 1.. 那个 1 的位置(比如说,k)......这个集合的基数是 2^k?
http://ravi-bhide.blogspot.com/2011/04/flajolet-martin-algorithm.html
但是……说我只有一个字。并且它的散列函数使得它生成的散列是2 ^ 5,那么我猜有5个(??)尾随0?所以它会预测 2^5 (??) 基数?这听起来不对?我错过了什么