我们已经在具有 4 个特征的数据集上使用 k=3 集群进行了 KMeans 聚类,并用输入特征绘制了每个集群的质心坐标。我们希望专注于一个集群,并尝试找出相对于其他特征,哪个特征对特定集群的贡献更大。我们对其他集群也这样做。
例如,让我们假设我们有c1
c2
c3
具有特征f1
f2
f3
和的集群f4
。集群的质心例如
C1
C2
C3
分别具有相应的特征f1
f2
f3
f4
f1 f2 f3 f4
C1 -2.02746249 2.10961828 -0.57917217 1.687631
C2 0.63967987 -0.55768793 0.76387423 0.265274
C3 -0.38727624 0.18714381 -1.27291271 -1.273105
我们能否推断出对于集群 1,因为f2
(feature2) 的质心最高,因此可以将其视为该特定集群的最重要/贡献最大的特征,类似地,对于集群 2,f3
(feature3) 的质心最高,因此可以将其视为集群 2 的重要特征。