根据此发布的页面 BCubed 精度和召回率,因此 F1-Measure 计算是评估聚类性能的最佳技术。参见Amigó、Enrique 等人。“基于形式约束的外在聚类评估指标的比较。” 信息检索 12.4 (2009): 461-486。
它显示了 BCubed 计算,如下图所示
所以据我了解,我们计算每个项目的精度和召回率,然后取它们的总和的平均值?
但是,我的理解与他们给定的评估不符,如下图所示
根据上图集群同质性示例 - 左侧,我计算 BCubed 的精度如下但不匹配
black : 4/4
gray: 4/7
Other three each one : 1/7
so average precision is : (4/4 + 4/6 + 1/7 + 1/7 + 1/7) / 5
然而,这与他们在图像中的结果不匹配0.59
项目的 BCubed 精度是其集群中具有项目类别(包括其自身)的项目的比例。整体 BCubed 精度是分布中所有项目的平均精度。由于平均值是针对项目计算的,因此无需根据集群或类别的大小应用任何权重。BCubed 召回是类似的,将“cluster”替换为“category”。