7

当我们说我们正在评估 WEKA frmework 中的集群时,我们的意思是什么?聚类是一种对对象进行分组的无监督方法。当我们说我们想要评估结果时,我们的意思是什么?此外,除此之外,当我们说我们在训练数据本身之上评估集群时,这是什么意思?

谢谢阿布舍克 S

4

1 回答 1

12

本页所述:

评估 Weka 评估集群的方式取决于您选择的集群模式。有四种不同的集群模式可用(作为集群模式面板中的按钮):

  1. Use training set(默认)。生成聚类后,Weka 根据聚类表示将训练实例分类为聚类,并计算每个聚类中实例的百分比。例如,上述由 k-means 生成的聚类显示集群 0 中的 43%(6 个实例)和集群 1 中的 57%(8 个实例)。
  2. 如果集群表示是概率性的(例如对于 EM),InSupplied test set或Weka 可以在单独的测试数据上评估集群。Percentage split
  3. Classes to clusters evaluation. 在这种模式下,Weka 首先忽略类属性并生成聚类。然后在测试阶段,它根据每个集群中类属性的多数值将类分配给集群。然后它根据这个分配计算分类错误,并显示相应的混淆矩阵。k-means 的一个例子如下所示。
于 2012-06-04T10:40:35.337 回答