谁能帮我集体计算F-measure?我知道如何计算召回率和精度,但不知道给定算法如何计算一个 F 度量值。
例如,假设我的算法创建了m个集群,但我知道相同数据有n 个集群(由另一个基准算法创建)。
我找到了一个 pdf,但它没有用,因为我得到的集体价值大于 1。pdf 的参考是F Measure Explained。具体来说,我看过一些研究论文,其中作者在F-measure的基础上比较了两种算法,它们共同得到了0到1之间的值。如果你仔细阅读上面提到的pdf,公式是F(C,K) = ∑ | 词 | / N * max {F(ci,kj)}
其中 ci 是参考集群 & kj 是由其他算法创建的集群,这里 i 从 1 运行到 n & j 从 1 运行到 m。假设 |c1|=218这里根据 pdf N=m*n 假设 m=12 和 n=10,对于 j=2,我们得到 max F(c1,kj)。F(c1,k2) 肯定在 0 和 1 之间。但是通过上面的公式计算得到的结果值我们会得到大于 1 的值。