0

我们有一个要求,我们必须在每个月的每一天,为各种组合(满足标准的用户)维护不同的计数。我们正在考虑为此使用 HyperLogLog,其他要求之一是为匹配条件(条件)提供联合和交集的计数。

我们必须在一天/一周/一个月内完成这些操作。据我所知,通过 hyperloglog 支持联合。对于超过 2 个 hyperloglog 的交叉点,错误率似乎很高。是否有任何其他数据结构可以用于交叉点,仅满足具有高基数的低空间要求,或者支持交叉点和联合以计算大的不同事件?

任何指针都会有所帮助。谢谢!!

4

1 回答 1

0

查看使用 MinHash 扩充HyperLogLog

于 2015-07-10T14:15:51.293 回答