8

我正在使用 caffe 训练一个底部带有欧几里德损失层的 CNN,并且我的 solver.prototxt 文件配置为每 100 次迭代显示一次。我看到这样的东西,

Iteration 4400, loss = 0
I0805 11:10:16.976716 1936085760 solver.cpp:229]     Train net output #0: loss = 2.92436 (* 1 = 2.92436 loss)

我对迭代损失和训练净损失之间的区别感到困惑。通常迭代损失非常小(大约为 0),而训练网络输出损失稍大一些。有人可以澄清一下吗?

4

1 回答 1

4

Evan Shelhamer 已经在https://groups.google.com/forum/#!topic/caffe-users/WEhQ92s9Vus上给出了答案。

正如他所指出的,net output #k结果是该特定迭代/批次的网络输出,而Iteration T, loss = X输出根据该average_loss字段在迭代中被平滑。

于 2015-12-01T07:07:23.637 回答