1

我正在尝试执行一类分类,这样我在训练期间只有正数据,而负数据仅在测试时可用。如果我使用一类 SVM 或任何其他一类方法,使用交叉验证方法估计参数存在一个常见问题,因为在训练阶段我们没有负数据。我认为通过仅使用正数据估计参数可能会出现一个问题,即在训练期间“过度拟合”,或者换句话说,如果我们只关心给我们提供最低假阴性率的参数,我们最终可能会得到参数(s ) 在测试过程中假阴性率为零,但假阳性率很高。

我的问题是,您能否建议我使用 CV 的参数估计方法或参考任何处理这种情况的论文。大多数谷歌搜索和文献评论都没有解决我的问题。为了简化这个问题,许多研究人员假设了一些异常值(或人为生成它们),但就我而言,我不能说任何关于负面概念的内容,因为我只知道正面数据是什么样的。您的反馈将不胜感激。

4

0 回答 0