我正在尝试使用 caffe 构建一个用于显着性分析的深度学习模型(我正在使用 python 包装器)。但我无法理解如何为此目的生成 lmdb 数据结构。我已经浏览了 Imagenet 和 mnist 示例,并且我知道我应该以格式生成标签
my_test_dir/picture-foo.jpg 0
但就我而言,我将用 0 或 1 标记每个像素,指示该像素是否显着。这不会是图像的单个标签。
如何为基于每个像素的标签生成 lmdb 文件?
我正在尝试使用 caffe 构建一个用于显着性分析的深度学习模型(我正在使用 python 包装器)。但我无法理解如何为此目的生成 lmdb 数据结构。我已经浏览了 Imagenet 和 mnist 示例,并且我知道我应该以格式生成标签
my_test_dir/picture-foo.jpg 0
但就我而言,我将用 0 或 1 标记每个像素,指示该像素是否显着。这不会是图像的单个标签。
如何为基于每个像素的标签生成 lmdb 文件?
检查这个:http ://deepdish.io/2015/04/28/creating-lmdb-in-python/
只需将所有图像X
和相应的标签加载到Y
.
在 caffe 中,lmdb 和 hdf5 都支持每个图像的多个标签,如果您喜欢矩阵,请参阅此线程:
https://github.com/BVLC/caffe/issues/1698#issue-53768814
请参阅本教程,了解如何使用 python 代码为 caffe 创建多标签数据集(此处为 lmdb):
http://www.kostyaev.me/article/Multilabel%20Dataset/
编辑:例如,对于标签,它使用 caffe-python 函数将 3 维数组转换为数据,可在 caffe/python/caffe.io.py 中找到:array_to_datum(arr, label=None):