-1

有大量文章描述过拟合,以及如何解决它们。一般定义是

过拟合可以通过检查准确性和损失等验证指标来识别。当模型受到过度拟合的影响时,验证指标通常会增加,直到它们停滞或开始下降。在上升趋势中,模型会寻求良好的拟合,当实现时,会导致趋势开始下降或停滞。

问题:我们是否应该只考虑验证准确度和损失来确定过拟合?

就我而言,我正在使用 IEMOCAP 数据集,我的最终指标如下所示。

                precision    recall  f1-score   support

         ang       0.48      0.45      0.46       170
         hap       0.55      0.24      0.34       442
         neu       0.42      0.56      0.48       384
         sad       0.46      0.69      0.55       245

    accuracy                           0.46      1241
   macro avg       0.48      0.48      0.46      1241
weighted avg       0.48      0.46      0.44      1241

混淆指标是这样的,

当我将它与其他实验结果进行比较时,这种混淆指标似乎很好。但是我的准确率和损失图清楚地显示了过度拟合。

模型损失 模型损失

模型精度 准确性

那么如何判断过拟合呢?我们还要考虑哪些其他参数?

4

1 回答 1

1

经典地识别过度拟合,你看作为训练损失的趋势和验证损失的趋势。如果在训练时期训练损失正在减少并且验证损失正在减少,那么您并没有过度拟合。如果训练损失在减少并且验证损失在没有过度拟合的平台附近振荡。该模型刚刚在验证集上做得最好。但是,如果训练损失正在减少并且验证损失趋势正在增加,那么您就过度拟合了。在你的情节上,我看到了非常轻微的过度拟合,但并不多。从我看到的情况来看,您的模型训练良好,但在表征验证数据方面并不成功。造成这种情况的原因之一可能是训练集中样本与验证集中样本的概率分布不同。验证样本是如何选择的?你的数据集中有多少样本?如果您有办法获得更多样本,则可以帮助解决问题。

于 2020-12-08T00:18:15.703 回答