我们有一个要求,我们必须在每个月的每一天,为各种组合(满足标准的用户)维护不同的计数。我们正在考虑为此使用 HyperLogLog,其他要求之一是为匹配条件(条件)提供联合和交集的计数。
我们必须在一天/一周/一个月内完成这些操作。据我所知,通过 hyperloglog 支持联合。对于超过 2 个 hyperloglog 的交叉点,错误率似乎很高。是否有任何其他数据结构可以用于交叉点,仅满足具有高基数的低空间要求,或者支持交叉点和联合以计算大的不同事件?
任何指针都会有所帮助。谢谢!!
我们有一个要求,我们必须在每个月的每一天,为各种组合(满足标准的用户)维护不同的计数。我们正在考虑为此使用 HyperLogLog,其他要求之一是为匹配条件(条件)提供联合和交集的计数。
我们必须在一天/一周/一个月内完成这些操作。据我所知,通过 hyperloglog 支持联合。对于超过 2 个 hyperloglog 的交叉点,错误率似乎很高。是否有任何其他数据结构可以用于交叉点,仅满足具有高基数的低空间要求,或者支持交叉点和联合以计算大的不同事件?
任何指针都会有所帮助。谢谢!!