1

我正在训练一个用于无监督学习的神经网络。我有一个训练集、验证集和测试集。训练和验证损失就像图中一样。我的问题是,当我只用一个 epoch 训练模型时,无论其他超参数如何,测试损失总是比我用多个 epoch 训练模型时要好。例如,使用 100 个 epoch,测试损失为 10.05。然而,相同的参数但只有 1 个 epoch,测试损失为 5.72。此外,测试损失总是高于验证损失。我认为该模型过度拟合,但我无法理解真正发生了什么。在此处输入图像描述

4

0 回答 0