3

从一组 n 个元素中随机选择一个元素的预期概率是 P=1.0/n 。假设我使用无偏方法检查 P 足够多次。P的分布类型是什么?很明显,P 不是正态分布的,因为它不能是负数。因此,我可以正确假设 P 是伽马分布的吗?如果是,这个分布的参数是什么?此处显示了从 100 个元素集中选择一个元素 1000 次的概率直方图。

有什么办法可以将其转换为标准分布

现在假设观察到的选择给定元素的概率是 P* (P* != P)。如何估计偏差在统计上是否显着?

编辑:这不是作业。我正在做一个爱好项目,我需要这个统计数据。大约 10 年前我已经完成了我的最后一个作业:-)

4

4 回答 4

3

这是一个明确的二项分布,p=1/(元素数)和 n=(试验数)。

要测试观察到的结果是否与预期结果有显着差异,您可以进行二项式检验

两个维基百科页面上的骰子示例应该为您提供一些关于如何制定问题的良好指导。在您的 100 元素、1000 试验示例中,这就像将 100 面模具滚动 1000 次。

于 2008-10-21T21:58:48.567 回答
3

通过重复,您的分布将是二项式的。所以让 X 是你选择某个固定对象的次数,总共有 M 个选择

P{ X = x } = ( M 选择 x ) * (1/N)^x * (N-1/N)^(Mx)

对于大的 N,您可能会发现这很难计算。事实证明,对于足够大的 N,这实际上会收敛到概率为 1 的正态分布(中心极限定理)。

如果 P{X=x} 将由正态分布给出。平均值为 M/N,方差为 M * (1/N) * ( N-1) / N。

于 2008-10-21T22:30:54.337 回答
1

正如其他人所指出的,您需要二项式分布。不过,您的问题似乎暗示着对它的连续近似感兴趣。它实际上可以用正态分布来近似,也可以用泊松分布来近似。

于 2008-10-24T13:50:25.777 回答
0

您的分布是离散均匀分布吗?

于 2008-10-21T21:25:29.973 回答