我有数据集,其中 20% 的数据是负类,80% 是正类。在计算 F 分数时,我假设精度为 TP/(TP+FP)。我应该“逆”公式,因为我的频率较低的课程是负数吗?所以是TN/(TN+FN)?
问问题
1258 次
1 回答
2
首先,你写的不是F1分数。那就是精密!
要计算 F1 分数,请设置精度=TP/(TP+FP) 和召回率=TP/(TP+FN)。它们的调和平均值是 F1 分数。所以,F1=2*(P*R)/(P+R)。有关更多详细信息,请参阅此内容。
您可以为每个类计算这些值,看看您在分类任务中的表现如何。如果您想为负类计算它,您最终会得到如您所说的计算真正的负例而不是真正的正例. 请注意,真正的肯定仅仅意味着正确分类为感兴趣的类别。它与类值无关。
最后,您还可以计算这两个类的精度、召回率和 f1 并取它们的平均值。这一切都取决于您要如何判断分类器的性能。如果准确分类负样本更重要,您应该专注于为负样本获得高精度(当然不要搞砸另一类!)召回也是如此。
于 2015-05-07T07:46:50.490 回答