1

如果我使用相对频率来估计事件的概率,那么基于实验次数的估计有多好?标准差是一个很好的衡量标准吗?纸质/链接/在线书籍将是完美的。

http://en.wikipedia.org/wiki/Frequentist

4

3 回答 3

4

我相信您正在寻找样本比例的置信区间。以下是一些可能有用的资源:

比例教程
的置信区间 比例讲义的置信区间

基本上,您的估计与样本数量的平方根成反比。因此,如果您想将错误减少一半,您将需要四倍的样本。

于 2009-05-08T16:22:43.240 回答
0

卡方检验可能是您想要的。例如,参见Pearson's chi-square test的维基百科页面。标准偏差不是您想要的,因为这与分布的形状有关,而不是您对实际分布的估计有多准确。另外,请注意,大多数这些都是关于“正态”分布的,并不是所有的分布都是正态的。

于 2009-05-08T16:11:42.440 回答
0

你在是/否实验的序列 n 中计算成功次数 s,对吗?只要单个实验是独立的,您就处于二项分布(维基百科)的领域。成功频率 f = s / n 是成功概率 p 和的估计量。对于 n 次抽签,您的频率估计 f 的方差为 p * (1-p) / n。

只要 p 不太接近 0 或 1,并且只要您没有“太小”的观察次数 n,标准差将是您估计 f 质量的合理衡量标准。

如果 n 足够大(经验法则 n * p > 10),您可以通过正态分布 N(f, f * (1-f) / n) 进行近似,标准差估计是一个很好的衡量标准。有关更广泛的讨论,请参见此处。

这就是说,如果这需要具有一定的学术严谨性(例如是家庭作业),使用标准偏差的近似值不会减少任何问题。

于 2009-05-08T17:18:46.087 回答