我在 Weka 中使用分类器和集群进行了一些预测。我知道如何分析分类器的结果,但我不知道像 K-means 这样的集群的某些结果的真正含义。我知道集群的工作方式不同。要更清楚我想在//注释下具体解释表格的全部含义:
编辑:我根据其中一个属性进行预测。表中生成的 3 个聚类是否对应于该属性具有的 3 个答案,或者 3 个聚类更随机?我真的可以使用聚类进行预测吗?
kMeans
======
Number of iterations: 9
Within cluster sum of squared errors: 297.46622082142716
Missing values globally replaced with mean/mode
Cluster centroids:
Cluster#
Attribute Full Data 0 1 2
(477) (136) (172) (169)
=======================================================
Religion 8.6939 7.6691 8.9709 9.2367
Vote_Criterion 2.7736 2.8971 2.4942 2.9586
Sex 1.4906 1.4559 2 1
DateBirth 1930.7652 1937.5147 1920.2965 1935.9882
Educ 3.2201 3.2721 3.2209 3.1775
Immigrant 1.6415 1.6838 1.5872 1.6627
Income 2.4675 2.5 2.5523 2.355
Occupation 3.6184 3.8162 3.2907 3.7929
Vote2013 1 2 1 1
Time taken to build model (full training data) : 0.06 seconds
=== Model and evaluation on training set ===
//PLEASE EXPLAIN THE FOLLOWING TABLE
Clustered Instances
0 136 ( 29%)
1 172 ( 36%)
2 169 ( 35%)
EDIT2:vote2013 是一个投票意向属性,有 3 个值,1,2 和 3 代表 3 位候选人总统。那么,vote2013 中的 1,2 是什么意思?