29

我知道 Precision 的概念以及 Recall 的概念。但我发现很难理解使任何 PR 曲线成为可能的“阈值”的概念。

想象一下,我有一个模型要构建,该模型使用一些关于相关特征的不错的分类算法来预测患者癌症的再次发生(是或否)。我将数据拆分用于训练和测试。假设我使用训练数据训练了模型,并使用测试数据获得了我的 Precision 和 Recall 指标。

但是我现在如何绘制 PR 曲线呢?依据是什么?我只有两个值,一个精度和一个召回率。我读到它的“阈值”可以让你获得几个精确召回对。但这个门槛是多少?我仍然是初学者,我无法理解阈值的概念。

我在很多分类模型比较中看到过,如下所示。但是他们是如何得到这么多对的呢?

使用精确召回曲线的模型比较

4

1 回答 1

32

ROC曲线:

  • x 轴:误报率 FPR = FP /(FP + TN) = FP / N
  • y 轴:真阳性率 TPR = 召回 = TP /(TP + FN) = TP / P

精确召回曲线:

  • x 轴:召回率 = TP / (TP + FN) = TP / P = TPR
  • y 轴:精度 = TP / (TP + FP) = TP / PP

您的癌症检测示例是一个二元分类问题。你的预测是基于概率的。(不)患癌症的概率。

通常,如果 P(A) > 0.5(您的阈值),则实例将被分类为 A。对于此值,您将获得基于 True Positives、True Negatives、False Positives 和 False Negatives 的 Recall-Precision 对。

现在,当您更改 0.5 阈值时,您会得到不同的结果(不同的对)。如果 P(A) > 0.3,您已经可以将患者归类为“患有癌症”。这将降低精确度并增加召回率。你宁愿告诉某人他有癌症,即使他没有,以确保癌症患者一定能得到他们需要的治疗。这代表了 TPR 和 FPR 或 Precision 和 Recall 或 Sensitivity 和 Speciality 之间的直观权衡。

让我们添加这些术语,因为它们在生物统计学中更常见。

  • 灵敏度 = TP / P = 召回 = TPR
  • 特异性 = TN / N = (1 – FPR)

ROC 曲线和 Precision-Recall 曲线可视化分类器的所有这些可能阈值。

如果仅靠准确性不是合适的质量衡量标准,您应该考虑这些指标。将所有患者分类为“没有癌症”将为您提供最高的准确度,但您的 ROC 和 Precision-Recall 曲线的值将是 1 和 0。

于 2017-09-14T17:39:39.920 回答