据我了解,如果 1. 收敛过快 2. 验证损失不断增加,则模型肯定是过拟合的
同样,据我所知,除非您使验证损失收敛到与训练损失相似的趋势,否则无法解决此问题,因此您可以进行更多的数据增强等。
然而,我读过的很多论文都声称 10 倍是稳健性的标志,表明模型没有过度拟合。但是,当我重新创建这些实验时,我可以说它们确实过拟合,无论它们是否显示出强大的准确性。此外,许多人似乎认为他们只会增加 10 倍,这很好。同样在评论中,他们只要求进行 10 倍的实验来解决过度拟合问题。
我的理解错了吗?是否有希望验证损失不会收敛但会上升?或者除了验证损失之外还有其他措施吗?