我通过阅读论文研究了 count min sketch (CMS):http: //dimacs.rutgers.edu/~graham/pubs/papers/cmsoft.pdf
但是我没有阅读算法的经验,所以有些混乱。有人可以帮忙回答一些关于count min sketch的问题。
- 假设深度为 d,w 为 w,那么我最多可以向 CMS 添加多少元素,这样就不会影响错误率
- 我想通过向 CMS 添加大量元素然后查询放入 CMS 的所有键来对 CMS 进行测试。如何计算误差和评估误差?
- 如果我将 CMS 用作 web 服务的重击者,并且我的 web 服务每天都在运行,那么有一天,计数器会溢出。那么我应该每天创建然后删除 CMS 吗?
谢谢!