3

我收到了来自 Weka 中协作生成的 AUC 和预测。后面的统计模型经过交叉验证,因此我的预测数据集包括折叠、预测概率和真实类别的列。鉴于 R 中的预测概率,使用此数据我无法复制 AUC。这些值总是略有不同。

额外细节:

  • Weka 是通过 GUI 使用的,而不是命令行
  • 我用包 pROC 和 ROCR 检查了 R 中的 AUC
  • 我首先尝试根据收集的预测计算 AUC(不考虑折叠),我得到了不同的 AUC
  • 然后我尝试计算每折的 AUC 并取平均值。这也不匹配。
  • 该模型是岭逻辑回归,预测中存在单一联系
  • 第一个折叠比其他折叠有一个样本。我试过取一个加权平均值,但这也没有奏效
  • 我什至测试了对数变换后的 AUC 平均值(对于正态性)
  • 取中位数而不是平均值也无济于事

我熟悉如何在 R 中计算 AUC,但我看不出 Weka 可以做些什么不同的事情。

4

0 回答 0