问题标签 [auc]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
5290 浏览

rdd - Evaluation Metrics for Binary Classification in Spark: AUC and PR curve

I was trying to calculate Precision, Recall by Threshold for LogisticRegressionwithLBFGS using BinaryclassificationMetrics. I got all those. I was trying to figure out if I could get a graphical output of PR and AUC curve.

Pasting my Codes below:

output from print(PRC):

I am not sure what is an union RDD and how to use it. Is there any other way to get the graphical output. Doing my research on it. Any suggestion would be great.

0 投票
1 回答
596 浏览

r - 以 cbind(Count_1, Count_0) 形式计算响应的 AUC 曲线

我使用 训练了一个二项式模型glm(Xtrain, ytrain, formula='cbind(Response, n - Response) ~ features', family='binomial'),其中 ytrain 是一个响应矩阵,其中包含计数(是)、计数(否)列。

我提供的测试响应与响应矩阵的形式相同。但是,predict() 函数返回概率——训练数据的每一行一个概率。我现在想使用 ROCR 或 AUC 包来生成 AUC 曲线,但我的预测和观察格式不同。有谁知道如何做到这一点?


好的。添加一个例子。原谅它毫无意义/排名不足/小,我只想说明我的情况。

此时,predict(model, dftest)返回我的数据框中最后两组特征的对数几率(给出死亡概率)。现在我想计算一条 AUC 曲线。我的观察在dftest[c('died','didntdie')]. 我的预测本质上是概率。AUC、ROCR 等期望预测和观察都是伯努利响应的列表。我找不到有关如何使用此响应矩阵的文档。任何帮助表示赞赏。

0 投票
1 回答
358 浏览

tensorflow - tensorflow 的 metrics(contrib) 仅显示有限的属性

我想在 tensorflow 中使用 tf.contrib.metrics.streaming_auc() 找到神经网络模型的 auc 值。但是 tf.contrib.metrics。除了 auc_histogram() 没有其他选项。tensorflow 中有很多可用的选项,但对我来说没有任何可用的选项。有人可以帮助我获取这些属性。

0 投票
3 回答
895 浏览

python-2.7 - Python、Roc 曲线和 ggplot?

我按照教程显示了 roc 曲线和相应的 auc;我从未使用过 ggplot 库,因此我无法理解我的错误在哪里。这里是下面的代码:

这是错误:

我该如何解决这个问题?

0 投票
0 回答
124 浏览

r - 自动计算移动窗口曲线下面积

我试图在一系列连续时间点找到太阳辐射强度图下的区域。基本上我想要过去 24 小时太阳辐射在 7 天内每小时的积分 - 过去 24 小时的移动总和 - (我怀疑土壤中的温度是过去 24 小时太阳辐射的结果)

这是我正在使用的代码,它可以工作,但我想自动化它,以便我可以轻松更改积分时间窗口(尝试 12、18、24,36 小时)并获得打印/保存的每小时积分太阳辐射表我可能会根据我的每小时温度数据绘制的值以查看是否存在关系)

这里: Rg - 10 分钟测量中的太阳辐射 num - 数据框中的条目号 AUC_xxx - 过去 24 小时的总太阳辐射

我尝试使用 rollapply,但我又被卡住了:

谢谢您的帮助 !

0 投票
4 回答
13413 浏览

machine-learning - 在平衡数据集中具有高 AUC 和低准确率的原因

给定一个平衡的数据集(两个类的大小相同),将其拟合到 SVM 模型中,我会产生高 AUC 值(~0.9)但准确度低(~0.5)。

我完全不知道为什么会发生这种情况,任何人都可以为我解释这个案例吗?

0 投票
1 回答
1329 浏览

r - 在 pROC 包中指定正类

我想使用 pROC 包计算不同的分类指标(敏感性、特异性)。为此,我可以将包中的coords函数pROC用作:

在这里它被认为1是积极的类,即可能是最流行的类,但我不确定。我想知道,是否可以使用“0”作为正类。例如,您可以在caret包的confusionMatrix功能中这样做:

因为1积极和

作为0正类。我正在使用 pROC 包,因为它提供了其他功能,例如确定最佳截止值等,这在插入符号中是不可能的。但是,有没有办法在包中指定正负类pROC

0 投票
2 回答
1031 浏览

python - sklearn.metrics 中的 AUC 分数是多少?

这里讨论的是auc分数,但这与常规的 roc_auc_score 不同。我没有看到对此的描述,它是什么以及它的用途是什么?

0 投票
1 回答
421 浏览

r - 灵敏度太低,因为插入符号训练交叉验证重采样结果中的 AUC 非常高

我应该如何解释:灵敏度太低,因为插入符号训练交叉验证重采样结果对我训练的数据的 AUC 非常高。

模型性能差吗?

0 投票
3 回答
1985 浏览

python - sklearn 或 python 中更快的 AUC

我有超过一百万对真实标签和预测分数(每个 1d 数组的长度各不相同,长度可能在 10,000-30,000 之间),我需要计算其 AUC。现在,我有一个 for 循环调用:

但是,处理整个数据集并计算每个真/预测对的 AUC 大约需要 1-1.5 小时。有没有更快/更好的方法来做到这一点?

更新

500k 个条目中的每一个都可以具有形状 (1, 10k+)。我知道我可以并行化它,但是我被困在只有两个处理器的机器上,所以我的时间实际上只能有效地减少到 30-45 分钟,这仍然太长了。我发现 AUC 计算本身很慢,并希望找到比 sklearn 中可用的更快的 AUC 算法。或者,至少,找到一种更好的方法来向量化 AUC 计算,以便它可以跨多行广播。