0

我看到 WEKA 接口需要在运行 X-means 聚类算法之前指定最小和最大聚类数。确定这些数字的好方法是什么?X-means不是应该减轻选择集群数量的负担吗?

4

1 回答 1

1

您可以使用您对数据的任何背景知识来设置最小和最大聚类数。XMeans 为您承担了一些负担,因为它不需要您指定集群的数量,而只限制集群的数量。如果您没有背景知识,则可以将它们设置为非常低和非常高的值。

例如,如果您想在 stackoverflow 上对问题进行聚类,并且您知道分配给每个问题的标签,则可以从标签总数、每个问题的标签等中得出界限。

这个问题的答案可能会有所帮助。一般来说,您必须尝试不同的值,看看哪个会产生您最喜欢的结果。

于 2015-09-08T16:10:16.933 回答