0

我有一大堆数据。无论集群的数量是多少,我都想创建大小相等的集群。我为此使用 SMILE 库。我应该使用什么聚类方法或如何实现具有相同大小的聚类的聚类。

4

1 回答 1

1

关于这个话题有一些讨论。

https://elki-project.github.io/tutorial/same-size_k_means

将 k 个相同大小的簇中的 n 个点分组

具有相等簇大小的 K-means 算法变化

另外,请查看 Affinity Propagation 和 DBSCAN。两者都是非常流行的 K-Means 算法的绝佳替代品,并且与 K-Means 不同,两者都自动找到最佳聚类数。

https://hdbscan.readthedocs.io/en/latest/comparing_clustering_algorithms.html

我并不是说这些会给您提供相同大小的集群,但是了解这些其他替代方案是很好的,并且使用这些方法可能比强制集群具有相同数量的数据点更实用。聚类是一种无监督的分析类型。似乎强制集群具有相同大小的结果在某种程度上是一种强制方法,并且几乎是有监督的,但它并不是设计的。

于 2021-02-10T01:02:14.670 回答