0

我使用 K-Means 算法来创建集群。如您所知,K-means 算法需要簇数作为参数。我尝试将集群计数从 8 开始计算为两个,并在每个循环中计算集群的所有 C-Index,然后获得这些 C-Index 的平均值。然后比较 C-Index 平均值并选择最小 C-Index 平均值作为最佳质量集群计数。这是检测集群计数的真正方法吗?

4

1 回答 1

1

没有一种正确的方法来检测集群计数。请参阅以下google 搜索,这仍然是一个活跃的研究领域。维基百科文章说:

k 的正确选择通常是模棱两可的,其解释取决于数据集中点分布的形状和比例以及用户所需的聚类分辨率。

只有您可以确定以这种方式使用 c-index 是否是确定域中簇数的好方法。请参阅在集群中使用 c-index 的另一个问题。

于 2014-12-09T08:48:38.197 回答