2

我需要向客户解释为什么骗子会出现在 2 次据称不同的考试之间。Prob and Stats 已经 20 年了。

我有一个生成的多项选择考试。数据库中有 192 个问题,100 个是随机选择的(没有重复)。

显然,这样生成的任何两次考试之间有 100% 的机会至少有 8 次重复。(鸽笼原理)

如何计算有 25 个骗子的概率?50个骗子?75个骗子?

-- 事后编辑 -- 我通过 excel 运行这个,从 n-100 中取概率的总和,对于这个特定的问题,概率是

n   P(n+ dupes)
40  97.5%
52  ~50% 
61  ~0
4

3 回答 3

2

嗯,这对我来说真的很朦胧。但是有(192 选择 100)可能的考试,对吧?

并且有(100 种选择 N)选择 N 个受骗者的方法,每种方法都有(92 种选择 100-N)选择其余问题的方法,不是吗?

因此,挑选 N 个骗子的概率不只是:

(100 选 N) * (92 选 100-N) / (192 选 100)

编辑:因此,如果您想要N 个或更多欺骗的机会而不是恰好 N,您必须将 N 的所有值的上半部分相加,从最小欺骗数到 100。

呃,也许……

于 2008-09-25T22:18:33.587 回答
1

创建第一个考试后,有 92 个问题从未使用过,还有 100 个问题已经使用过。如果您现在生成另一个考试,其中包含 100 个问题,那么您将从一组 92 个从未使用过的问题和 100 个已经使用过的问题中进行选择。很明显,你会得到相当多的重复。

您会期望得到 (100/192) * 100 个重复问题,即在任意两个随机选择的考试中,(平均)会有 52 个重复问题。

如果你想要有 25、75 或其他的概率,那么你有两个选择。

a) 计算数学

b) 在电脑上模拟几次运行

于 2008-09-25T22:13:08.657 回答
0

它可能比你想象的要高。我不会尝试复制这篇文章:http ://en.wikipedia.org/wiki/Birthday_paradox

于 2008-09-25T22:02:46.417 回答