我正在使用 caffe 训练一个底部带有欧几里德损失层的 CNN,并且我的 solver.prototxt 文件配置为每 100 次迭代显示一次。我看到这样的东西,
Iteration 4400, loss = 0
I0805 11:10:16.976716 1936085760 solver.cpp:229] Train net output #0: loss = 2.92436 (* 1 = 2.92436 loss)
我对迭代损失和训练净损失之间的区别感到困惑。通常迭代损失非常小(大约为 0),而训练网络输出损失稍大一些。有人可以澄清一下吗?