假设您有以下数据集,其中观察到了两个变量 Color 和 Size:
颜色 | 尺寸 ------+------ 红色 | 大的 白色 | 小的 红色 | 小的 红色 | 大的 白色 | 大的 红色 | 大的
要求您学习贝叶斯网络的最大似然参数,如下所示:
颜色 -> 尺寸
对于表中描述的学习问题,您可以获得更多数据,但新数据集包含缺失值。您现在可以使用哪种算法来学习最大似然参数?
假设您有以下数据集,其中观察到了两个变量 Color 和 Size:
颜色 | 尺寸 ------+------ 红色 | 大的 白色 | 小的 红色 | 小的 红色 | 大的 白色 | 大的 红色 | 大的
要求您学习贝叶斯网络的最大似然参数,如下所示:
颜色 -> 尺寸
对于表中描述的学习问题,您可以获得更多数据,但新数据集包含缺失值。您现在可以使用哪种算法来学习最大似然参数?
如果您只是丢弃缺少值的案例,您将获得不准确的值。
因此,您需要对概率进行预测,并且可以为此使用期望最大化算法。http://en.wikipedia.org/wiki/Expectation%E2%80%93maximization_algorithm