python - Caffe 迭代损失与训练净损失

Question

我正在使用 caffe 训练一个底部带有欧几里德损失层的 CNN，并且我的 solver.prototxt 文件配置为每 100 次迭代显示一次。我看到这样的东西，

Iteration 4400, loss = 0
I0805 11:10:16.976716 1936085760 solver.cpp:229]     Train net output #0: loss = 2.92436 (* 1 = 2.92436 loss)

我对迭代损失和训练净损失之间的区别感到困惑。通常迭代损失非常小（大约为 0），而训练网络输出损失稍大一些。有人可以澄清一下吗？

score 4 · Accepted Answer

正如他所指出的，net output #k结果是该特定迭代/批次的网络输出，而Iteration T, loss = X输出根据该average_loss字段在迭代中被平滑。

1 回答 1