0

我想知道测试集的结果是否用于优化模型的权重。我正在尝试制作模型,但我的问题是我没有很多数据,因为他们是医学研究患者。在我的案例中,患者数量有限(61),每个患者有 5 个特征向量。我尝试的是通过排除一个主题来创建一个深度学习模型,并将排除的主题用作测试集。我的问题是主题特征有很大的可变性,我的模型很适合训练集(60 个主题),但对于 1 个排除的主题不太好。所以我想知道是否可以以某种方式使用测试集(在我的情况下为排除对象)来使模型收敛以更好地对排除对象进行分类?

4

2 回答 2

4

您不应在训练过程中使用数据集的测试数据。如果您的训练数据不够,那么在这几天(尤其是医学图像)使用很多的一种方法是数据增强。所以我强烈建议你在训练过程中使用这种技术。如何在数据有限时使用深度学习 是关于数据增强的好教程之一。

于 2018-11-30T15:21:03.650 回答
0

不,您不应该使用您的测试集进行训练以防止过度拟合,如果您使用交叉验证原则,您需要将数据完全拆分为三个数据集,一个用于训练模型的训练集,一个用于训练模型的验证集测试您的超参数的不同值,以及最终测试您的模型的测试集,如果您使用所有数据进行训练,您的模型显然会过拟合。

如果您拥有庞大且非常丰富的数据集,请记住深度学习的一件事

于 2018-11-30T14:18:30.120 回答