0

正如我们从 K-Means 中知道的,在样本数据聚集在 N 个集群中(每个集群都有一个质心向量)之后,并非所有数据都聚集在它们所属的集群中!我的意思是某些数据向量可能聚集在错误的簇中。这意味着即使在 K-Means 中,聚类时也没有 100% 的精度。我想知道这样的“错误”是否也出现在 SOM 算法中。那么……在 SOM 算法收敛后,是否有任何不属于它们实际放置的节点的数据样本?

我希望我的问题足够清楚。我期待你的答案。

4

1 回答 1

0

SOM 根据提供的输入对数据进行聚类。集群的形成取决于输入呈现给网络的方式。

SOM 通过最小化地图格中的获胜节点与实际输入向量之间的距离来对输入进行聚类,然后对紧邻的权重进行调整。因此,属于单个类的输入被映射到形成集群的同一位置周围。

因此,当算法收敛时,除非在以下情况下,否则这种情况不太可能发生

  1. 没有提供足够的数据点来训练网络
  2. 使用的学习率值不合适
  3. SOM 正确聚类,我们没有看到聚类中的共同(隐藏)特征,并且倾向于认为聚类中存在错误(发生在我身上很多次)。

我不是 SOM 的专家,但从经验中回答。希望这可以帮助。

于 2013-04-21T04:22:36.563 回答