0

在学校的数据挖掘课程中,我收到了以下关于素描的问题:

考虑一个带有时间戳的事件流: t 1 < t 2 <...

我们有兴趣维护一个时间戳的草图,这将使我们能够估计随着当前时间 t 衰减的时间,CV 为 ε

T α =Σα(t i )

对于任何衰减函数 α

我尝试使用莫里斯计数器,因为它具有对数大小,并且对衰减函数中具有最大值的第一个时间戳进行采样的概率更大。

但是莫里斯计数器的 CV 是一个常数,我不知道如何修改它。

编辑:到目前为止我的解决方案:

initialize: x = 0, result = 0
for each new timestamp t:   
- sample it with probability of 2^(-x)
- if it is sampled:
   - x++
   - result = result  + α(t)
4

0 回答 0