neural-network - Caffe 中的标签作为图像

Question

我是 Caffe 的新手。我正在尝试为语义分割实现全卷积神经网络 ( FCN-8s )。我有图像数据和标签数据，它们都是图像。这是针对像素级的预测。

我尝试使用 ImageData 作为数据类型，但它要求一个整数标签，这不适用于这种情况。请告知我如何给 Caffe 一个 2D 标签。我应该更喜欢 LMDB 而不是 ImageData？如果是这样，我该如何进行？对于这种情况，我找不到任何好的教程/文档。

score 5 · Accepted Answer

由于您需要实现逐像素预测，因此您不能将单个标签用作基本事实。相反，您应该使用标签的真实矩阵。

一位 Caffe 人员编写了一个代码片段，用于使用图像数据创建 LMDB，请参见此处：

import caffe
import lmdb
from PIL import Image

in_db = lmdb.open('image-lmdb', map_size=int(1e12))
with in_db.begin(write=True) as in_txn:
    for in_idx, in_ in enumerate(inputs):
        # load image:
        # - as np.uint8 {0, ..., 255}
        # - in BGR (switch from RGB)
        # - in Channel x Height x Width order (switch from H x W x C)
        im = np.array(Image.open(in_)) # or load whatever ndarray you need
        im = im[:,:,::-1]
        im = im.transpose((2,0,1))
        im_dat = caffe.io.array_to_datum(im)
        in_txn.put('{:0>10d}'.format(in_idx), im_dat.SerializeToString())
in_db.close()

neural-network - Caffe 中的标签作为图像

1 回答 1

Related

Reference