math - 概率和相对频率

Question

如果我使用相对频率来估计事件的概率，那么基于实验次数的估计有多好？标准差是一个很好的衡量标准吗？纸质/链接/在线书籍将是完美的。

score 4 · Accepted Answer

我相信您正在寻找样本比例的置信区间。以下是一些可能有用的资源：

基本上，您的估计与样本数量的平方根成反比。因此，如果您想将错误减少一半，您将需要四倍的样本。

score 0 · Accepted Answer

卡方检验可能是您想要的。例如，参见Pearson's chi-square test的维基百科页面。标准偏差不是您想要的，因为这与分布的形状有关，而不是您对实际分布的估计有多准确。另外，请注意，大多数这些都是关于“正态”分布的，并不是所有的分布都是正态的。

score 0 · Accepted Answer

你在是/否实验的序列 n 中计算成功次数 s，对吗？只要单个实验是独立的，您就处于二项分布（维基百科）的领域。成功频率 f = s / n 是成功概率 p 和的估计量。对于 n 次抽签，您的频率估计 f 的方差为 p * (1-p) / n。

只要 p 不太接近 0 或 1，并且只要您没有“太小”的观察次数 n，标准差将是您估计 f 质量的合理衡量标准。

如果 n 足够大（经验法则 n * p > 10），您可以通过正态分布 N(f, f * (1-f) / n) 进行近似，标准差估计是一个很好的衡量标准。有关更广泛的讨论，请参见此处。

这就是说，如果这需要具有一定的学术严谨性（例如是家庭作业），使用标准偏差的近似值不会减少任何问题。

3 回答 3