我正在尝试计算AUC
一个大型数据集,并且无法找到一个既能处理不仅仅是 0 或 1 的值又能合理快速地工作的数据集。
到目前为止,我已经尝试过这个ROCR
包,但它只处理 0 和 1,pROC
包会给我一个答案,但可能需要 5-10 分钟来计算 100 万行。
请注意,我的所有值都介于 0 - 1 之间,但不一定是 1 或 0。
编辑:答案和预测都在 0 - 1 之间。
有什么建议么?
编辑2:
ROCR
可以处理这样的情况:
Ex.1
actual prediction
1 0
1 1
0 1
0 1
1 0
或像这样:
Ex.2
actual prediction
1 .25
1 .1
0 .9
0 .01
1 .88
但不是这样的情况:
Ex.3
actual prediction
.2 .25
.6 .1
.98 .9
.05 .01
.72 .88
pROC
可以处理Ex.3,但计算时间很长。我希望对于像 Ex.3 这样的情况有更快的实现。