我最近阅读了关于期望最大化 (EM) 的文章,并且不断出现使用 K-Means 初始化 EM 是一个好主意,但我在掌握这个概念时遇到了困难。
据我所知,在使用 kmeans 时,您得到的结果是根据预定义的集群数量的集群质心坐标,那么如何使用它来初始化 EM。为了让事情更清楚,这是我目前正在尝试解决的问题:
我有一个噪声数据点 Y 的数据集,它来自从 8-ASK 集合中提取的样本 X。现在我加载了我的数据集并使用了 kmeans 算法来识别质心,但似乎不知道下一步是什么。我使用的 EM 算法需要参数:质心的初始起始值及其概率分布以及初始均值和方差,但我不明白如何准确获得这些值。
总结一下我的问题基本上是当我在我的数据 Y 上运行他时,我如何计算 kmeans 算法生成的质心的均值、方差和初始分布?