1

给定这个数据集:

颜色 | 尺寸

红色 | 大的

白色 | 小的

红色 | 大的

红色 | 小的

白色 | 大的

红色 | 大的

和以下贝叶斯网络:Color --> Size,我应该找到贝叶斯网络的最大似然参数。估算器会是什么?我不知道如何在这里继续,所以任何帮助将不胜感激。

4

1 回答 1

5

假设您的颜色和尺寸变量是多项分布,您需要估计以下参数θ

颜色:

  • Theta_red: 红色概率。
  • Theta_white: 白色概率。

对于尺寸:

  • Theta_big|红色: 变大的概率是红色的。
  • Theta_big|白色: 大的概率是白色的。
  • Theta_small|红色: 红色的概率很小。
  • Theta_small|白色: 小概率是白色的。

最后只有 3 个,因为

  • theta_white = 1 - theta_red,
  • theta_small|red = 1 - theta_big|red
  • theta_small|white = 1 - theta_big|white

可能性是给定模型的观测数据的概率,在这种情况下,对于具有 n 个颜色和大小观测值的数据集:

D = {(color_1, size_1), ..., (color_n, size_n)},

和参数:

theta = {theta_red, theta_big|red, theta_big|white},

可能性由下式给出:

可能性

由于我们在这里处理颜色和给定颜色大小的伯努利分布,我们可以这样写:

在此处输入图像描述

where在此处输入图像描述是红色和小观察的计数,其他 Ms 定义相同。

最后,通过优化似然函数,可以得到参数估计量:

  • 在此处输入图像描述
  • 在此处输入图像描述
  • 在此处输入图像描述
于 2014-12-11T15:39:08.550 回答