因此,我正在对大约 12600 张图像进行 4 标签 X 射线图像分类:
Class1:4000
Class2:3616
Class3:1345
Class4:4000
我使用的是 imageNet 数据集上的 VGG-16 架构,具有交叉熵和 SGD在 pytorch 上运行的批量大小为 32,学习率为 1e-3
[[749., 6., 50., 2.],
[ 5., 707., 9., 1.],
[ 56., 8., 752., 0.],
[ 4., 1., 0., 243.]]
我知道,由于火车损失/acc 都相对 0/1,因此模型过度拟合,尽管我很惊讶 val acc 仍然在 0.9 左右!如何正确解释它以及导致它的原因以及如何预防它?我知道这有点像,因为准确度是 softmax 的 argmax,就像实际预测越来越低,但 argmax 始终保持不变,但我真的很困惑!我什至让它训练 +64 epochs 相同的结果 flat acc 而损失逐渐增加!
PS。我已经看到其他问题的答案,并没有真正得到解释