2

假设您有以下数据集,其中观察到了两个变量 Color 和 Size:

颜色 | 尺寸
------+------
红色 | 大的
白色 | 小的
红色 | 小的
红色 | 大的
白色 | 大的
红色 | 大的

要求您学习贝叶斯网络的最大似然参数,如下所示:

颜色 -> 尺寸

对于表中描述的学习问题,您可以获得更多数据,但新数据集包含缺失值。您现在可以使用哪种算法来学习最大似然参数?

4

1 回答 1

4

如果您只是丢弃缺少值的案例,您将获得不准确的值。

因此,您需要对概率进行预测,并且可以为此使用期望最大化算法。http://en.wikipedia.org/wiki/Expectation%E2%80%93maximization_algorithm

于 2013-12-10T18:11:48.570 回答