我一般无法理解计算训练集 AUC 的附加值,但对于这个问题,我使用的是 PLS-DA 的示例。
假设您已经建立了一个 PLS-DA 模型来尝试查看该模型是否可以区分糖尿病患者和非糖尿病患者。在此之后,模型的绘图和可视化表明存在某种区分能力。请注意,此 PLS-DA 模型仅基于训练数据/训练集。
在这种情况下,使用 ROC 曲线计算 AUC 的附加值是多少?
假设您绘制 ROC 曲线并计算 AUC 为 0.9。这明确意味着什么?我很想这意味着该模型能够/有可能以 90% 的准确率区分糖尿病患者和非糖尿病患者。但是有些事情告诉我这是不对的,因为毕竟;我的模型的性能只能在绘制 ROC 曲线并计算验证集和测试集的 AUC 后评估,对吗?还是我看错了?