0

我有3节课。(50k 用于训练,12k 用于验证)通过使用预训练的 vgg16 和 resnet50,并冻结模型并仅在顶部训练密集层,我达到了 99% 的验证准确率。我应该通过解冻层来微调以改进功能,还是应该按原样使用这些功能?另外,vgg16 是比 Resnet50 更好的特征提取器还是我应该使用 Resnet 的特征?谢谢!

4

1 回答 1

1

这取决于您的问题域。如果您正在为相同的问题域微调预训练模型并且训练数据量很小,那么您所做的就是正确的。

也许如果你只冻结第一层,这些层在一般特征提取(egdes、blob、shapes ..etc)上训练有素,你可以提高你的表现。如果要这样做,还建议应用数据增强以避免过度拟合

我鼓励您查看以下有关迁移学习的教程以获取更多详细信息: http ://cs231n.github.io/transfer-learning/

于 2017-09-05T09:47:11.840 回答