我正在尝试使用随机森林数据绘制 ROC 曲线:
mdl <- randomForest(QdataTrainX, QdataTrainY)
m<-predict(mdl,QdataTestX)
OOB.x <- predict (mdl,QdataTrainX,type="prob");
OOB.pred <- OOB.x[,2];
pred.obj <- prediction (OOB.pred,QdataTrainY);
RP.perf <- performance(pred.obj, "rec","prec");
plot (RP.perf@alpha.values[[1]],RP.perf@x.values[[1]],type="l",ylim=c(0,1));
这是我的 ROC 曲线:
我正在使用已发布的数据
测试数据 - https://docs.google.com/file/d/0B0iDswLYaZ0zVENwUUhENnhZeTg/edit?usp=共享 训练数据 - https://docs.google.com/file/d/0B0iDswLYaZ0zdXN6UzU3Y3pPUEU/edit?usp=sharing
,他们展示的 ROC 曲线经过原点:
这使我认为我在某处滥用了参数。任何人都可以看到我的代码有什么问题吗?