我正在使用数据集使用 EM 和 K-means 制作 2 个集群。我已经分别实现了 K-means 和 EM 算法。现在我试图从我的 EM 算法实现中推导出 k-means 来进行聚类。我有2个问题。
K-means 被视为广义 EM 算法的一个特例。但是我们需要做出哪些假设才能从 EM 算法中推导出 k-means 呢?
此外,从编码的角度来看,我们需要在 EM 算法的实现中进行哪些更改,以使其开始表现得与 k-means 算法完全一样?我假设我们需要在两个集群之间共享相同的协方差矩阵。这是正确的假设吗?
这就是我使用 k-means 得到的结果。
这是使用 EM 进行聚类。