c++ - 没有 lmdb 的 Caffe+Opencv

Question

使用 caffe 时，要创建包含图像的训练数据集，我们需要以 lmdb 等特殊格式创建数据库，但是有任何选项可以传递给 caffe 批量图像，例如vector<cv::Mat>？

为了澄清我正在寻找可以处理大量无法放入内存的图像的解决方案（但假设一个训练批次（例如包含 50 个图像）可以存储在内存中）。

score 7 · Accepted Answer

Caffe 可以接受多种类型的输入，具体取决于我们使用的输入层。一些可用的输入法是：

数据
内存数据
HDF5数据
图像数据等

在模型文件中，您找到的第一层将是Layer type: Data，用作lmdb or leveldb输入法。将一组图像转换为这些数据库非常容易，因为 Caffe 已经提供了转换图像的工具。

Layer type: MemoryData直接从内存中读取数据，这在测试阶段使用相机输入作为 Caffe 输入时非常有用。强烈不建议使用该层进行训练。

将Layer type: ImageData文本文件作为输入。文本文件包含所有图像名称及其完整路径和类别编号。Caffe 使用 OpenCV 读取该层中的图像。它还负责对图像的所有转换。因此，建议不要使用 OpenCV 读取图像然后传递给 MemoryData 层，而是使用 ImageData。

ImageData 层从中读取图像的 .txt 格式必须为：

/path/to/the/image/imageName.jpg classNumber

强烈建议使用 LMDB 或 LevelDB，因为如果图像路径或名称包含空格，或者任何图像损坏，ImageData 就无法正常工作。

可以在此处找到各个层的详细信息。

根据模型和批量大小在 GPU 中分配内存。如果发生内存溢出，您可以尝试减小批量大小。Caffe 轻松处理了包含 120 万张图像的 Imagenet 数据库的训练。因此，在最佳批量大小的情况下，算法应该可以正常工作。

c++ - 没有 lmdb 的 Caffe+Opencv

1 回答 1

Related

Reference