目前我正在关注caffe imagenet 示例,但将其应用于我自己的训练数据集。我的数据集大约有 2000 个类,每个类大约 10 ~ 50 张图像。实际上我是在对车辆图像进行分类并且图像被裁剪到前面,所以每个类中的图像具有相同的大小,相同的视角(几乎)。
我已经尝试过 imagenet 架构,但看起来效果不佳,经过大约 3000 次迭代后,精度降至 0。所以我想知道是否有关于如何调整架构的实用指南?
目前我正在关注caffe imagenet 示例,但将其应用于我自己的训练数据集。我的数据集大约有 2000 个类,每个类大约 10 ~ 50 张图像。实际上我是在对车辆图像进行分类并且图像被裁剪到前面,所以每个类中的图像具有相同的大小,相同的视角(几乎)。
我已经尝试过 imagenet 架构,但看起来效果不佳,经过大约 3000 次迭代后,精度降至 0。所以我想知道是否有关于如何调整架构的实用指南?
您可以删除 imagenet 中的最后一层,使用不同的名称添加您自己的最后一层(以适应类的数量),使用更高的学习率指定它,并指定较低的整体学习率。这里确实存在一个官方示例:http: //caffe.berkeleyvision.org/gathered/examples/finetune_flickr_style.html
但是,如果准确度为 0,则应先检查模型参数,可能是溢出