1

我一直在自己的 googlenet 实现上训练 cifar 100 数据集。起初,我在 200 个 epoch 中实现了大约 71% 的 top-1 准确率,然后我通过热身训练、使用nesterov 动量的 sgd 和学习率调度将其提高到 78.5%。

我也一直在使用一些标准的增强功能,比如用 4 个零填充、32x32 随机裁剪、随机水平翻转和 rgb 通道标准化。

现在我想看看我是否可以使用更多的增强技术将准确率进一步提高到 79-80 甚至超过 80%。我的问题是:

1) 我可以将 Cutout 与我之前提到的标准增强一起应用吗?还是它们相互排斥?

2)自动增强显然为数据集找到了“最佳”增强策略。如果我应用自动增强,我还需要使用 cutout 和我之前的增强吗?还是可以全部一起使用?

3)我已经训练了 200 个 epoch(批量大小为 128),因为我已经在各种论文中看到它被多次完成,并且在我自己的实现中,过去 200 个 epoch 的训练没有显着改进。应用 cutout 和/或 autoaugment 后,我​​应该训练超过 200 个 epoch 吗?我的学习率从 0.1 开始,在第 60,120,160 个 epoch 下降(下降因子为 0.2)。我是否应该添加更多学习率里程碑并训练多达 300 个 epoch?

4

0 回答 0