2

给定这样的数据:SN = 灵敏度;SP = 特异性

Cutpoint        SN   1-SP
       1       0.5    0.1
       2       0.7    0.2
       3       0.9    0.6

如何绘制 ROC 曲线并计算 AUC。并比较两条不同 ROC 曲线之间的 AUC。在大多数包如 pROC 或 ROCR 中,数据的输入与上面显示的不同。任何人都可以建议用 R 或其他方法解决这个问题的方法吗?

ROCsdat <- data.frame(cutpoint = c(5, 7, 9), TPR = c(0.56, 0.78, 0.91), FPR = c(0.01, 0.19, 0.58))

## plot version 1
op <- par(xaxs = "i", yaxs = "i")
plot(TPR ~ FPR, data = dat, xlim = c(0,1), ylim = c(0,1), type = "n")
with(dat, lines(c(0, FPR, 1), c(0, TPR, 1), type = "o", pch = 25, bg = "black"))
text(TPR ~ FPR, data = dat, pos = 3, labels = dat$cutpoint)
abline(0, 1)
par(op)
4

2 回答 2

3

我想你可以手动计算它:

dat <- data.frame(tpr=c(0, .5, .7, .9, 1), fpr=c(0, .1, .2, .6, 1))
sum(diff(dat$fpr) * (dat$tpr[-1] + dat$tpr[-length(dat$tpr)]) / 2)
# [1] 0.785

您需要让tprfpr向量以 0 开头并以 1 结尾才能正确计算 AUC。

于 2014-03-15T01:34:35.133 回答
3

首先,我建议您访问您当地的图书馆并找到一本关于 R 的介绍性书籍。在编写自己的代码之前有一个坚实的基础很重要,并且在没有真正理解的情况下复制粘贴在互联网上找到的代码是什么意思充其量是有风险的。

关于您的问题,我相信 (0,0) 和 (1,1) 坐标是 ROC 曲线的一部分,因此我将它们包含在数据中:

ROCsdat <- data.frame(cutpoint = c(-Inf, 5, 7, 9, Inf), TPR = c(0, 0.56, 0.78, 0.91, 1), FPR = c(0, 0.01, 0.19, 0.58, 1)) 

曲线下面积

我强烈建议不要在 R 训练的这个阶段设置自己的梯形积分函数。它太容易出错,而且很容易因一个小(语法)错误而搞砸。

相反,请使用完善的集成代码,例如以下trapz函数pracma

library(pracma)
trapz(ROCsdat$FPR, ROCsdat$TPR)

绘图

我认为你大部分都得到了绘图,尽管我会稍微不同地写它:

plot(TPR ~ FPR, data = ROCsdat, xlim = c(0,1), ylim = c(0,1), type="b", pch = 25, bg = "black")
text(TPR ~ FPR, data = ROCsdat, pos = 3, labels = ROCsdat$cutpoint)
abline(0, 1, col="lightgrey")

比较

为了进行比较,假设您在auc1和中有两个 AUC auc2。if/else 语法如下所示:

if (auc1 < auc2) {
    cat("auc1 < auc2!\n")
} else if (auc1 == auc2) {
    cat("aucs are identical!\n")
} else {
    cat("auc1 > auc2!\n")
}
于 2014-03-15T08:16:32.997 回答