有两套1 2 3
和独特的项目。3 4
3
2
现在让我们计算合并集中的唯一项目。如果我们只是总结计数器3 + 2 = 5
,那将是错误的(应该是uniq(1 2 3 3 4) = 4
)。
有没有办法只使用计数器来做到这一点?对于每个计数器,可以使用一些额外的常量内存数据结构来表示原始集合,小错误也可以,假设 95% 的准确度是可以的。
我知道有使用很少内存(HyperLogLog)的概率唯一计数器。但是有没有办法合并两个这样的概率计数器?
有两套1 2 3
和独特的项目。3 4
3
2
现在让我们计算合并集中的唯一项目。如果我们只是总结计数器3 + 2 = 5
,那将是错误的(应该是uniq(1 2 3 3 4) = 4
)。
有没有办法只使用计数器来做到这一点?对于每个计数器,可以使用一些额外的常量内存数据结构来表示原始集合,小错误也可以,假设 95% 的准确度是可以的。
我知道有使用很少内存(HyperLogLog)的概率唯一计数器。但是有没有办法合并两个这样的概率计数器?