我正在使用 K-Means 和聚类研究 WEKA。
一般来说,我会检查项目数据集上的不同算法。
我无法决定我应该选择什么最佳 SSE/Clusters 比率。
理论上,当我增加集群时,SSE 会减少,但是直到哪里?
找到了一些 K = (n/2)^0.5 的手指规则,有人可以支持这个吗?
问问题
1782 次
我正在使用 K-Means 和聚类研究 WEKA。
一般来说,我会检查项目数据集上的不同算法。
我无法决定我应该选择什么最佳 SSE/Clusters 比率。
理论上,当我增加集群时,SSE 会减少,但是直到哪里?
找到了一些 K = (n/2)^0.5 的手指规则,有人可以支持这个吗?