0

假设一个黑盒随机数生成器在某个间隔内连续发出整数值(对于直接感兴趣的情况,[0, 255])。我想估计概率质量函数及其变化的一些度量,并且我想在新样本进入时定期更新这些估计,而不必存储到目前为止的整个样本集。

  • 请建议用于计算和更新这些估计值的数值稳定算法。
  • 请建议对 PMF 变化的适当测量。
4

1 回答 1

1

离散分布的 pmf 只是每个结果的相对比例。创建一个长度为 256 的数组,初始化为全零。对于每个值,在该索引处递增数组。按观察总数缩放以将结果表示为相对比例(估计概率)。瞧,即时经验 pmf,即使您有数百万或数十亿个观察值,您也只能存储 256 个值。如果结果仅限于一个小子集,请使用散列而不是数组。

给定值和相关计数,您可以构建任何您喜欢的集中趋势或变化度量。对于变化,您可以考虑范围、四分位间距或方差和/或标准偏差。

于 2013-05-02T18:28:30.667 回答