0

我正在尝试使用 AlexNet https://github.com/akrizhevsky/cuda-convnet2 实现图像搜索引擎

这个想法是通过训练神经网络对图像进行分类,然后使用网络最后一个隐藏层的代码作为相似性度量来实现图像搜索引擎。

我试图弄清楚如何在一组新图像上训练 CNN 以对它们进行分类。有谁知道如何开始这个?

谢谢

4

1 回答 1

0

你基本上有两种方法来解决你的问题:

- 您要么拥有大量良好的训练数据 (>1M) 和数十个 GPU,然后使用 SGD 和用于查询的类从头开始重新训练网络。

- 要么你不这样做,然后你简单地截断一个预训练的 AlexNet(你截断它的确切位置供你选择)并将其插入你的图像(可能调整大小以适应网络(如果我没记错的话,227x227x3))。然后从您的图像中获得一个特征向量(有时称为描述符),然后使用这些特征向量在您的图像和特定任务上训练线性 SVM。

于 2016-04-25T09:26:24.513 回答