2

根据此发布的页面 BCubed 精度和召回率,因此 F1-Measure 计算是评估聚类性能的最佳技术。参见Amigó、Enrique 等人。“基于形式约束的外在聚类评估指标的比较。” 信息检索 12.4 (2009): 461-486。

它显示了 BCubed 计算,如下图所示

在此处输入图像描述

所以据我了解,我们计算每个项目的精度和召回率,然后取它们的总和的平均值?

但是,我的理解与他们给定的评估不符,如下图所示

在此处输入图像描述

根据上图集群同质性示例 - 左侧,我计算 BCubed 的精度如下但不匹配

black : 4/4
gray: 4/7
Other three each one : 1/7

so average precision is : (4/4 + 4/6 + 1/7 + 1/7 + 1/7) / 5

然而,这与他们在图像中的结果不匹配0.59

项目的 BCubed 精度是其集群中具有项目类别(包括其自身)的项目的比例。整体 BCubed 精度是分布中所有项目的平均精度。由于平均值是针对项目计算的,因此无需根据集群或类别的大小应用任何权重。BCubed 召回是类似的,将“cluster”替换为“category”。

4

1 回答 1

2

有 14 个项目,而不是 5 个。

(4*4/4+1/3+2*2/3+3*1/7+4*4/7)/14 = 0.5986394557823128

但这些只是玩具示例。我更喜欢调整后的兰德指数而不是 BCubed,它的知名度和接受度要广得多。

于 2016-04-06T11:34:44.317 回答