0

我需要创建一个脚本,提示每第 4 或第 9 个用户作为一天内访问的用户的样本,但我没有办法存储全局计数器(文件系统、内存等),是否有算法或函数可以近似选择第 n 个用户吗?

甚至概率抽样也可以……说 25%

近似的,最好是速度比准确性更快的东西

4

1 回答 1

4

另一种方法可能是概率抽样。

如果要对每个第 K 个用户进行采样(对于某些特定的 k),则需要在范围内生成一个随机整数[0,K)- 当且仅当生成的数字为 0(或实际上是任何其他单个数字)时才对该用户进行采样。

抽样用户的预期数量将与您对每 k 个用户抽样的数量相同。

于 2012-09-21T21:24:38.190 回答