有大量文章描述过拟合,以及如何解决它们。一般定义是
过拟合可以通过检查准确性和损失等验证指标来识别。当模型受到过度拟合的影响时,验证指标通常会增加,直到它们停滞或开始下降。在上升趋势中,模型会寻求良好的拟合,当实现时,会导致趋势开始下降或停滞。
问题:我们是否应该只考虑验证准确度和损失来确定过拟合?
就我而言,我正在使用 IEMOCAP 数据集,我的最终指标如下所示。
precision recall f1-score support
ang 0.48 0.45 0.46 170
hap 0.55 0.24 0.34 442
neu 0.42 0.56 0.48 384
sad 0.46 0.69 0.55 245
accuracy 0.46 1241
macro avg 0.48 0.48 0.46 1241
weighted avg 0.48 0.46 0.44 1241
混淆指标是这样的,
当我将它与其他实验结果进行比较时,这种混淆指标似乎很好。但是我的准确率和损失图清楚地显示了过度拟合。
那么如何判断过拟合呢?我们还要考虑哪些其他参数?