在学校的数据挖掘课程中,我收到了以下关于素描的问题:
考虑一个带有时间戳的事件流: t 1 < t 2 <...
我们有兴趣维护一个时间戳的草图,这将使我们能够估计随着当前时间 t 衰减的时间,CV 为 ε
T α =Σα(t i )
对于任何衰减函数 α
我尝试使用莫里斯计数器,因为它具有对数大小,并且对衰减函数中具有最大值的第一个时间戳进行采样的概率更大。
但是莫里斯计数器的 CV 是一个常数,我不知道如何修改它。
编辑:到目前为止我的解决方案:
initialize: x = 0, result = 0
for each new timestamp t:
- sample it with probability of 2^(-x)
- if it is sampled:
- x++
- result = result + α(t)