我有一大堆数据。无论集群的数量是多少,我都想创建大小相等的集群。我为此使用 SMILE 库。我应该使用什么聚类方法或如何实现具有相同大小的聚类的聚类。
问问题
76 次
1 回答
1
关于这个话题有一些讨论。
https://elki-project.github.io/tutorial/same-size_k_means
另外,请查看 Affinity Propagation 和 DBSCAN。两者都是非常流行的 K-Means 算法的绝佳替代品,并且与 K-Means 不同,两者都自动找到最佳聚类数。
https://hdbscan.readthedocs.io/en/latest/comparing_clustering_algorithms.html
我并不是说这些会给您提供相同大小的集群,但是了解这些其他替代方案是很好的,并且使用这些方法可能比强制集群具有相同数量的数据点更实用。聚类是一种无监督的分析类型。似乎强制集群具有相同大小的结果在某种程度上是一种强制方法,并且几乎是有监督的,但它并不是设计的。
于 2021-02-10T01:02:14.670 回答