我正在使用 weka 进行 K-means 聚类,当我尝试了一个小集合并发现聚类内的平方误差和 (WCSS) 值不是我想的那样。
我认为 WCSS 是所有元素到它的集群中心的平方距离之和,但值不正确:
例如:数据集是:
3.0, 2.0, 3.0, 0.0, 0.0, 2.0, 1.0, 0.0, 1.0
4.0, 1.0, 3.0, 0.0, 1.0, 0.0, 1.0, 4.0, 1.0
4.0, 1.0, 7.0, 0.0, 1.0, 1.0, 0.0, 1.0, 1.0
3.0, 2.0, 7.0, 0.0, 0.0, 2.0, 1.0, 1.0, 0.0
3.0, 2.0, 6.0, 1.0, 0.0, 1.0, 0.0, 2.0, 1.0
4.0, 2.0, 5.0, 1.0, 1.0, 1.0, 1.0, 0.0, 0.0
4.0, 1.0, 8.0, 0.0, 1.0, 2.0, 0.0, 0.0, 1.0
3.0, 2.0, 2.0, 0.0, 1.0, 1.0, 0.0, 0.0, 1.0
3.0, 2.0, 0.0, 0.0, 1.0, 1.0, 1.0, 3.0, 1.0
并且集群(只有一个)中心是3, 2, 3, 0, 1, 1, 1, 0, 1
:
weka 输出的 WCSS 是 39,但根据我的理解,应该是133
. 我知道我对 WCSS 的含义一定是错的,有人可以告诉我吗?