当我们说我们正在评估 WEKA frmework 中的集群时,我们的意思是什么?聚类是一种对对象进行分组的无监督方法。当我们说我们想要评估结果时,我们的意思是什么?此外,除此之外,当我们说我们在训练数据本身之上评估集群时,这是什么意思?
谢谢阿布舍克 S
当我们说我们正在评估 WEKA frmework 中的集群时,我们的意思是什么?聚类是一种对对象进行分组的无监督方法。当我们说我们想要评估结果时,我们的意思是什么?此外,除此之外,当我们说我们在训练数据本身之上评估集群时,这是什么意思?
谢谢阿布舍克 S
如本页所述:
评估 Weka 评估集群的方式取决于您选择的集群模式。有四种不同的集群模式可用(作为集群模式面板中的按钮):
Use training set
(默认)。生成聚类后,Weka 根据聚类表示将训练实例分类为聚类,并计算每个聚类中实例的百分比。例如,上述由 k-means 生成的聚类显示集群 0 中的 43%(6 个实例)和集群 1 中的 57%(8 个实例)。Supplied test set
或Weka 可以在单独的测试数据上评估集群。Percentage split
Classes to clusters evaluation
. 在这种模式下,Weka 首先忽略类属性并生成聚类。然后在测试阶段,它根据每个集群中类属性的多数值将类分配给集群。然后它根据这个分配计算分类错误,并显示相应的混淆矩阵。k-means 的一个例子如下所示。