我手头有一个分类问题,我想用机器学习算法来解决(贝叶斯或马尔科夫可能,这个问题独立于要使用的分类器)。给定一些训练实例,我正在寻找一种方法来衡量已实施分类器的性能,同时考虑数据过度拟合问题。
也就是说:给定 N[1..100] 个训练样本,如果我对每个样本运行训练算法,并使用这些相同的样本来测量适应度,它可能会陷入数据过度拟合问题——分类器会知道训练实例的确切答案,没有太多的预测能力,使得适应度结果毫无用处。
一个明显的解决方案是将手工标记的样本分成训练样本和测试样本;我想了解选择具有统计意义的样本进行训练的方法。
非常感谢白皮书、书籍指南和 PDF!