1

我正在从事二进制分类任务。我的评估数据不平衡,由 appr 组成。20% 来自第 1 类,80% 来自第 2 类。即使我在每个类类型上都有很好的分类准确度,如在 class1 上为 0.602,在 class2 上为 0.792,如果我计算 class1 上的 f1 分数,我得到 0.46,因为误报计数很大。如果我在 class2 上计算它,我得到 f1-score 为 0.84。

我的问题是,评估不平衡数据分类任务的最佳实践是什么?我可以得到这些 f1 分数的平均值还是应该选择其中一个?在不平衡数据上评估分类任务的最佳评估指标是什么?

顺便说一句,这些是我的 TP、TN、FN、FP 计数;

总价:115

田纳西州:716

前锋:76

FP:188

4

1 回答 1

4

我不确定这是否是您正在寻找的,但由于您想要从中获取性能指标的数据不平衡,您可以尝试应用加权测量,例如加权 f1 分数。从 scikit-learn 中,f1-score 具有“加权”选项,它考虑每个标签的实例数。通过这种方式,您可以获得平均 F1 分数。

https://scikit-learn.org/stable/modules/generated/sklearn.metrics.f1_score.html

我希望这会有所帮助!

于 2020-03-06T12:28:22.273 回答