再会!
不幸的是,尽管有资源,但我一直在互联网上寻找如何计算轮廓系数、凝聚力和分离度的方法,但我就是无法理解发布的公式。我知道在某些工具中有它的实现,但我想知道如何手动计算它们,特别是在给定向量空间模型的情况下。
假设我有以下集群:
集群 1 ={{1,0},{1,1}}
集群 2 ={{1,2},{2,3},{2,2},{1,2}},
集群 3 ={{ 3,1},{3,3},{2,1}}
根据[1],我理解它的方式是我必须得到每个集群点的平均值:
C1 X = 1;Y = .5
C2 X = 1.5; Y = 2.25
C3 X = 2.67;Y = 1.67
给定平均值,我必须通过平方误差和 (SSE) 来计算我的凝聚力:
内聚力(C1) = (1-1)^2 + (1-1)^2 + (0-.5)^2 + (0-.5)^2 = 0.5
内聚力(C2) = (1-1.5) ^2 + (2-1.5)^2 + (2-1.5)^2 + (1-1.5)^2 + (2-2.5)^2 + (3-2.5)^2 + (2-2.5)^2 +(2-2.5)^2 = 2
内聚力(C3) = (3-2.67)^2 + (3-2.67)^2 + (2-2.67)^2 + (1-1.67)^2 + (3- 1.67)^2 + (1-1.67)^2 = 3.3334
集群 (C) = 0.5 + 2 + 3.3334 = 5.8334
我的问题是:
1. 我是否正确地执行了凝聚力?
2. 我如何计算分离?
3. 如何计算轮廓系数?
谢谢你。
参考文献:
[1] http://www.cs.kent.edu/~jin/DM08/ClusterValidation.pdf