问题标签 [auc]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
1158 浏览

r - 如何从 geom_density/stat_density 显示 AUC 的值

我使用 ggplot2 和 stat_density 制作了一些密度图。我的同事提到他不相信每条曲线下的面积总和为 1。所以,我开始计算曲线下的面积,我想知道是否有比我所做的更好的方法。

这是我所做的一个例子:

结果:

它似乎工作得很好,但我想知道是否有更好的方法来做到这一点。特别是,我对间隔(即 dx,我想)的计算似乎可能是一个问题,特别是如果不同的密度曲线使用不同的间隔。

0 投票
2 回答
3672 浏览

r - R 中的 3 类 AUC 计算(pROC 包)

我在 R 中遇到了一个 3 类 ROC 分析的问题,得到了一个非常烦人的结果(见这里)。现在我尝试使用不同的方法来解决它。数据是iris,分类器是nnet包中的多项逻辑回归。代码如下:

我的问题是:
这是使用pROC包的正确方法吗?
非常感谢!!!

一些相关参考:
pROC包: http: //www.inside-r.org/packages/cran/pROC/docs/multiclass.roc
Hand & Till(2001)原论文: http: //link.springer.com/article/10.1023%2FA%3A1010920819831

0 投票
1 回答
6873 浏览

r - 插入符号 rfe + 和 ROC 中的特征选择

我一直在尝试使用 caret 包应用递归特征选择。我需要的是 ref 使用 AUC 作为性能指标。谷歌搜索一个月后,我无法让该过程正常工作。这是我使用的代码:

执行此脚本时,我得到以下结果:

该过程始终使用准确性作为性能指标。出现的另一个问题是,当我尝试从使用以下方法获得的模型中获得预测时:

我收到以下消息

事实证明,从模型中得到一些预测是不可能的。

以下是通过获取的信息sessionInfo()

0 投票
1 回答
3923 浏览

python-2.7 - 绘制多条 ROC 曲线,或多类标签的平均曲线(多项回归)

我有一个包含多个离散标签的数据集,比如 4、5、6。在此我运行 ExtraTreesClassifier(我还将在相同的数据上运行 Multinomial logit afterword,这只是一个简短的示例),如下所示。:

问题是 -是否有类似平均 ROC 曲线的东西- 基本上我可以将所有 tpr 和 fpr 分别加起来以获得每个标签值,然后采取手段(顺便说一句有意义吗?) - 然后只需调用

我假设,我会得到类似于这个后记的东西——但在这种情况下我如何解释阈值? 如何为 knn 模型绘制 ROC 曲线

因此,还请提及在这种情况下我是否可以/应该获得单独的阈值,以及为什么一种方法(统计上)优于另一种方法?

到目前为止我尝试过的(除了平均):

在更改 pos_label = 4 ,然后 5 & 6 并绘制 roc 曲线时,我发现性能非常差,甚至低于 y=x (完全随机且 tpr=fpr 情况)我应该如何解决这个问题?

0 投票
2 回答
1962 浏览

lua - Torch/Lua,如何计算曲线下面积(AUC)?

我是 Torch 的新手,我正在研究一个问题,我必须描述接收器操作特性 (ROC) 曲线及其曲线下面积 (AUC)。

我必须数组:TPrate在 y 轴和FPratex 轴上,同时具有大小n

如何在 Torch7 或 Lua 中计算此函数的曲线下面积?

我还从 JayClascoe.com 找到了这段代码,但我不知道如何使用它的功能。

0 投票
1 回答
5133 浏览

python - Python:将曲线下面积与x中的不均匀步长积分

我有一个 y 值列表和一个 x 值列表。我想找到这些点定义的曲线下的区域。对于具有均匀间距的 x 值,我找到了几个解决此问题的方法:

1)在给定一组坐标的情况下计算曲线下面积,不知道函数

2)使用scipy对样本进行离散积分

但是当 x 值的间距不均匀时,这些都不起作用。

例如:

当然,在上面的代码中使用 x = np.array([0,10,20,30]) 返回 30.0,正如预期的那样。

谁能建议一种方法来找到 x 间距不均匀的曲线下的区域?

0 投票
2 回答
3619 浏览

r - gbm 包中的 ROC 分数

我在使用 gbm 包计算 ROC 分数 (AUC) 时遇到问题。我正在使用增强的回归树。我正在运行的脚本是:

它应该产生“训练数据 ROC 分数”和“交叉验证 ROC 分数”以及其他相关参数。我没有得到 ROC 分数。我打电话names(testing.tc5.lr005)。如果我调用它会列出cv.roc.matrix但会产生以下内容testing.tc5.lr005$cv.roc.matrix

[1] 0 0 0 0 0 0 0 0 0 0

roc(TestData$TN,predTN)我尝试通过(TestData~用于预测的数据,即观察值;predTN~预测值)来计算 ROC AUC 。结果是[1]NA. 我不知道我做错了什么,尽管模型的其余部分似乎在合理的测试和 CV 相关性和 SE 值方面做得很好。任何关于我错在哪里或替代的指示将不胜感激!谢谢

0 投票
2 回答
6404 浏览

r - 绘制 ROC 曲线并计算 R 在特定截止信息处的 AUC

给定这样的数据:SN = 灵敏度;SP = 特异性

如何绘制 ROC 曲线并计算 AUC。并比较两条不同 ROC 曲线之间的 AUC。在大多数包如 pROC 或 ROCR 中,数据的输入与上面显示的不同。任何人都可以建议用 R 或其他方法解决这个问题的方法吗?

0 投票
1 回答
840 浏览

r - caTools 包中的 R 函数 colAUC 因大样本而失败

例如:

工作正常,但是

我做错了什么,或者这可能是一个错误?ROCR::performance 为这种大小的样本提供了一个合理的答案。

0 投票
1 回答
1104 浏览

r - 如何运行将跨所有自变量、对和三元组运行的逻辑回归循环

我想运行逻辑回归的因变量(在我的数据集中它是:dat$admit),其中包含所有可用变量、对和三元组(3 个独立变量),每个回归都有不同的自变量与因变量。我想要返回的结果是一个连续的每个回归摘要的列表:系数、p 值、AUC、CI 95%。使用下面提交的数据集应该有 7 个回归:

这是一个样本数据集(其中 dat$admit 是逻辑回归因变量):

根据@marek 评论,输出应该是这样的(仅针对女性以及来自女性和 apcalc ): # Intercept Estimate P-Value (Intercept) P-Value (Estimate) AUC # female 0.000000e+00 0.000000e+00 1 1 0.5

女性+apcalc 0.000000e+00 0.000000e+00 1 1 0.5

@David Arenburg 编写了一个很好的代码,它可以生成统计数据,但没有配对和三重奏的模型创建,所以我想知道如何添加模型创建。这是大卫阿伦伯格的代码吗?

知道如何创建此列表吗?谢谢,罗恩