我刚开始使用这个kml包来执行纵向 k-means 聚类R。
默认情况下,该kml函数使用Calinski Harabatz Sorted标准来选择“最佳”聚类。因此,通过访问“最佳”聚类,您将始终看到Calinski Harabatz Sorted标准。
我们如何选择另一个质量标准?
一个最小的例子:
library(kml)
# some data
cld <- generateArtificialLongData(25)
# perform clustering
kml(cold)
# choose the 'best' clustering:
choice(cld)
这绘制了类似的内容:
因此,我们看到了实际数据、聚类和左侧的质量标准。现在对于“Calinski Harabatz Unsorted”,“最佳”数量是四个集群。但是如果我们选择另一个质量标准呢?
例如,要绘制具有不同数量集群的另一个解决方案,我可以这样做:
plot(cld, 3, toPlot = 'both')
所以在这里我们看到了一个包含三个集群的集群,并且仍然是上面的相同标准。
我们如何绘制另一个度量的质量标准,例如Ray 和 Turie?

