我已经为我的研究实现了一个自制的 ZFNet ( prototxt )。在定义了 20k 次迭代后,测试准确率保持在 ~0.001(即 1/1000),测试损失在 ~6.9,训练损失在 ~6.9,这似乎网络在 1k 类中一直在玩猜谜游戏。我已经彻底检查了整个定义并尝试更改一些超参数以开始新的训练,但无济于事,屏幕上显示相同的结果......
谁能给我点灯?提前致谢!
prototxt 中的超参数来自论文 [1]。正如论文中的图 3 所示,所有层的输入和输出似乎都是正确的。
调整是:
crop
-s 用于训练和测试的输入都设置为,225
而不是224
#33 中讨论的那样;、 和的 1 像素零填充
conv3
,以使 blob 的大小保持一致 [1];conv4
conv5
所有可学习层的填充类型从
constant
[1] 更改为gaussian
withstd: 0.01
;weight_decay
:按照@sergeyk 在 PR #33 中的建议从更改为0.0005
;0.00025
[1] Zeiler, M. 和 Fergus, R. 可视化和理解卷积网络,ECCV 2014。
而对于可怜的部分......,我把它贴在这里