1

一天,我们遇到了大约 10 分钟的 ISP 故障,不幸的是,这发生在从多个地点进行的托管考试期间。

不幸的是,这导致候选人当前页面的回发数据丢失。

我可以从服务器日志中重建事件流。但是,在 317 名候选人中,有 175 名使用本地代理,这意味着他们似乎都来自同一个 IP。我分析了其余 142 个(45%)的数据,并得出了一些很好的数字来说明它们发生了什么。

问题:将我所有的数字乘以 317/142 以获得整个集合的可能结果有多正确?我的(非)确定性区域是什么?

请不要猜测。我需要一个在统计课上没有睡着的人来回答。

编辑:按数字,我指的是受影响个人的数量。例如,5/142 在会话期间显示了浏览器崩溃的证据。11/317 浏览器崩溃的推断有多正确?

4

1 回答 1

2

我不确定我们到底在谈论什么测量,但现在让我们假设你想要平均分之类的东西。估计总体(317 名候选人)的平均分数不需要调整。只需使用样本的平均值(您分析的 142 个数据)。

要找到您的不确定区域,您可以使用NIST 统计手册中给出的公式。你必须首先决定你愿意有多不确定。假设您希望真实总体均值位于区间内的置信度为 95%。然后,真实总体均值的置信区间为:

(样本平均值)+/- 1.960*(样本标准差)/sqrt(样本大小)

您可以进行进一步的更正,以将相对于总体的大量样本归功于自己。他们会将置信区间收紧约 1/4,但有很多假设认为上述计算已经使它不那么保守了。一种假设是分数大致呈正态分布。另一个假设是样本代表总体。您提到缺失的数据都来自使用相同代理的候选人。使用该代理的人口子集可能与其他人口有很大不同。

编辑:由于我们正在讨论具有属性的样本的一部分,例如“浏览器崩溃”,所以事情有点不同。我们需要对一个比例使用置信区间,并通过乘以人口规模将其转换回成功次数。这意味着我们对崩溃浏览器数量的最佳估计是 5*317/142 ~= 11,正如您所建议的那样。

如果我们再次忽略我们的样本几乎是总体一半的事实,我们可以使用一个比例的威尔逊置信区间可以在线使用计算器为您处理公式。计算器和公式的输出是总体分数的上限和下限。要获得崩溃次数的范围,只需将上限和下限乘以(总体大小 - 样本大小),然后再加回样本中的崩溃次数。虽然我们可以简单地乘以总体规模来获得区间,但这会忽略我们已经知道的样本。

基于 142 个样本点中的 5 次崩溃,使用上述程序得出 317 总体中浏览器崩溃总数的 95% CI 为 7.6 到 19.0。

于 2008-11-29T08:46:28.540 回答