machine-learning - 贝叶斯学习中的缺失值

Question

假设您有以下数据集，其中观察到了两个变量 Color 和 Size：

颜色 | 尺寸
------+------
红色 | 大的
白色 | 小的
红色 | 小的
红色 | 大的
白色 | 大的
红色 | 大的

要求您学习贝叶斯网络的最大似然参数，如下所示：

颜色 -> 尺寸

对于表中描述的学习问题，您可以获得更多数据，但新数据集包含缺失值。您现在可以使用哪种算法来学习最大似然参数？

score 4 · Accepted Answer

如果您只是丢弃缺少值的案例，您将获得不准确的值。

因此，您需要对概率进行预测，并且可以为此使用期望最大化算法。http://en.wikipedia.org/wiki/Expectation%E2%80%93maximization_algorithm

1 回答 1