我正在使用 scikit-learn 执行二进制分类,但是标签在整个数据集中分布不均匀。对于我对预测少数类感兴趣的情况,我对metrics.average_precision_score
. 当我运行实验并打印分类报告时,我看到总体精度方面表现良好,但这显然来自模型在预测多数类方面做得很好,如下所示:
precision recall f1-score support
label of interest 0.24 0.67 0.35 30
non-label 0.97 0.81 0.88 300
然后将average precision
其报告为0.9752
. 这个平均精度分数显然是针对大多数班级报告的,这并不是我真正感兴趣的班级。是否有某种方法可以修改metrics.average_precision_score
函数以报告与少数感兴趣类别相关的指标?任何见解将不胜感激 - 感谢您的阅读。