我正在一起学习EM算法和GMM
我不理解维基百科中描述的 EM 算法:
EM算法用于在方程不能直接求解的情况下找到统计模型的最大似然参数。通常,这些模型除了未知参数和已知数据观察之外还涉及潜在变量。
直到现在,我对这种情况下的潜在变量感到好奇。
也就是说,要么数据中存在缺失值,要么可以通过假设存在其他未观察到的数据点来更简单地制定模型。
这句话,你能举一个关于丢失或未观察到的数据的简单例子吗?
不幸的是,维基百科中有一个例子,但我很难理解这个概念,我对高斯混合模型中的隐藏数据感到好奇。
我认为均值、协方差和加权因子是未知参数。
那么高斯混合模型中的隐藏数据是什么?
还是我的想法错了?