0

我有一个不平衡数据集,我使用 smote 对少数类进行过采样,对多数类进行欠采样。现在,我想使用模型的 predict_proba 检查测试 AUC。

我有两个问题: 1. 如果我比较 AUC,我是否必须更正概率?2.我该如何纠正它(欠采样和过采样的组合!)

4

1 回答 1

0

(1) 好消息是没有,在比较 AUC 时不必纠正。重采样校正是未校正分数的严格递增函数,因此不会改变事例的顺序,因此 ROC 完全相同。

(2) 在欠采样/过采样后有一个简单的校正公式,我忘了它是什么,我很确定网络搜索会找到它。

进一步讨论最适合 stats.stackexchange.com。

于 2019-11-21T18:48:19.817 回答