我正在尝试使用集群节点和 CCC 标准找到最佳集群大小。
Automatic 设置(默认)将 SAS Enterprise Miner 配置为使用 Ward 或 Centroid 方法自动确定要创建的最佳集群数量。但是,我在自动方法、“最佳”集群大小的选择以及报告的统计数据方面存在一些严重问题。选择的选项是 Cluster Method=Ward、Prelim Max=50、Min=5、Final Max=50、CCC Cutoff=3。
输出显示了三个候选集群的最佳数量 k=6、10 和 46,CCC=-104、-80 和 163。选择了最好的,即 k=46,CCC=163。同时,Cluster Statistics 报告指出生成的 CCC 为 294,但是可用范围内的最大 CCC 仅为 163(k <= 50)。有趣的是,当初步最大值逐渐增加到 500 时,两个报告的 CCC 值之间的差异越来越小。
输出中显示的 CCC 值与图表和聚类最佳 k 的选择一致。集群统计表中的 CCC 值纯属幻想,我看不出有任何方法可以将其转化为任何有意义的东西。
我的分析有问题吗?
PS 我已经阅读了集群节点帮助。