10

我有一些我不太了解的机器学习结果。我正在使用 python sciki-learn,有大约 14 个特征的 2+ 百万数据。“ab”的分类在精确召回曲线上看起来很糟糕,但 Ab 的 ROC 看起来与大多数其他组的分类一样好。这有什么可以解释的?

在此处输入图像描述

在此处输入图像描述

4

1 回答 1

14

阶级不平衡。

与 ROC 曲线不同,PR 曲线对不平衡非常敏感。如果您在不平衡数据上优化分类器以获得良好的 AUC,您可能会获得较差的精确召回结果。

于 2015-10-23T07:40:12.583 回答