0

我正在将一组图像和一组地面实况图像转换为 LMDB 数据库。目的是逐像素预测。大部分用于从 RGB 图像创建 LMDB 的代码都有一行表示按CxHxW顺序转置,如下所示:

im = im.transpose((2,0,1)) # convert to CxHxW

我的图像数据(训练数据和相应的地面实况图像)是灰度的(即单通道)。我的问题是,这条线的目的是什么,我应该为我的single channel图像和基本事实做这个矩阵转置还是没有必要?

感谢您的帮助。

4

1 回答 1

1

Caffe 以 BGR 格式而不是 RGB 处理图像。由于 ImageNet 上的大多数预训练模型都是以 BGR 格式训练的,因此默认应用此操作(转置)。如果您正在对灰度图像进行训练,则不需要这样做。此外,即使您是从头开始对 RGB 图像进行训练,也没有必要。

于 2017-01-03T21:05:22.850 回答