0

我从了解高斯混合模型的概念中阅读了 GMM 的概念。这对我很有帮助。我也为 fisheriris 实现了 GMM,但我没有使用 fitgmdist 函数,因为我没有它。所以我使用了来自http://chrisjmccormick.wordpress.com/2014/08/04/gaussian-mixture-models-tutorial-and-matlab-code/的代码。

当我阅读理解高斯混合模型的概念时,Amro 可以使用其标签(即 setosa、virginica 和 versicolor)绘制结果。他是怎么做到的呢?经过一些迭代,我只得到了 mu、Sigma 和 weight。根本没有标签。我想将标签(setosa、virginica 和 versicolor)放入 GMM 迭代中的混合模型。

4

1 回答 1

0

该图中有两组“标签”:

  • 一个是 Fisher Iris 数据集的“真实”标签(species包含每个实例的类的变量:setoasversicolorvirginica)。通常,您不会在真实数据集中拥有这些(毕竟聚类的目标是发现数据中的那些组,而您事先并不知道这些组)。我只是在这里使用它们来了解 EM 聚类对实际情况的执行情况(散点根据类进行颜色编码)。

  • 另一组标签是我们使用 GMM 找到的集群。基本上,我构建了一个 50x50 的 2D 点网格来覆盖整个数据域,然后通过计算后验概率并选择具有最高可能性的组件来为每个点分配一个集群。我以背景颜色显示了这些集群。作为一个很好的结果,我们可以看到集群之间的判别决策边界。

您可以看到左侧的点簇被很好地分开(并且与setosa类完美匹配)。虽然图右侧的点被分成两个与其他两个类匹配的点,但如果你愿意的话,也会出现“错误分类”的实例(边界错误一侧的一些绿点)。

通常在真实环境中,您不会有那些实际的类进行比较,因此无法判断您的聚类有多“准确”(存在其他用于聚类性能评估的指标)......

于 2014-10-18T09:08:46.267 回答