-1

我有一个练习,我得到了 5 个数据点:

x1 = 10, x2 = 7, x3 = 1, x4 = 15, x5 = 8独立生成。

对于第一部分,我被告知他们遵循参数 theta 的泊松分布,我被要求找到 theta 的最大似然估计。

我计算argmax(theta) of ln(x1,x2,x3,x4,x5 | theta)并得到了结果

theta = 41/5 = 8.2.

对于第二部分,我被问到同样的事情,但这次我被告知他们遵循参数 theta 的指数分布

我做了同样的微积分,得到的结果是

theta = 5/41 = 0.12.

现在我被问到这两个分布(泊松或指数)中的哪一个最有可能产生 5 个点(x1、x2、x3、x4、x5)。

基本上,我需要找出这两个分布中哪一个最有可能产生 5 个点,基于(我相信)我为这两个分布计算的 theta。

但我似乎无法弄清楚我需要找到的这两个概率的形式是什么。是MAP概率吗?P(θ | x1,x2,x3,x4,x5) ? 如果是,我可以使用贝叶斯公式得到

P(x1,x2,x3,x4,x5 | theta) * P(theta) / P(x1,x2,x3,x4,x5)。但是什么是 P(theta) 和 P(x1,x2,x3,x4,x5) ?

有任何想法吗?

4

1 回答 1

1

系统会询问您这两个模型中哪一个更有可能,因此您需要知道两个分布的先验。由于您对它们一无所知,而且只有两个,假设先验是 1/2,那么您有:

P(distr = x | data) = P(data | distr = x) P(distr = x) / P(data)

因此

P(distr = exp | data) > P(distr = poiss | data) <-> 
P(data | distr = exp) > P(data | distr = poiss)

您所要做的就是比较您已经完成的这两个概率(来自 MLE)。

P(data) 无关紧要,因为它在两种情况下都是相同的。P(distr=x) 我们假设是相等的,所以也没关系。通常,人们以各种方式修改 P(distr=x) 以考虑分布的“复杂性”(这就是 AIC 和其他东西所做的事情 - 他们假设分布的参数化与其先验概率之间存在一些启发式映射)。

于 2017-01-23T22:30:53.223 回答