cluster-analysis - 如何创建大小相等的集群

Question

我有一大堆数据。无论集群的数量是多少，我都想创建大小相等的集群。我为此使用 SMILE 库。我应该使用什么聚类方法或如何实现具有相同大小的聚类的聚类。

score 1 · Accepted Answer

关于这个话题有一些讨论。

另外，请查看 Affinity Propagation 和 DBSCAN。两者都是非常流行的 K-Means 算法的绝佳替代品，并且与 K-Means 不同，两者都自动找到最佳聚类数。

我并不是说这些会给您提供相同大小的集群，但是了解这些其他替代方案是很好的，并且使用这些方法可能比强制集群具有相同数量的数据点更实用。聚类是一种无监督的分析类型。似乎强制集群具有相同大小的结果在某种程度上是一种强制方法，并且几乎是有监督的，但它并不是设计的。

1 回答 1