0

我已经开始在 MatConvNet 中使用带有基本二进制分类的 CNN。我有 90 张图像,总共有 750 个飞机和地面实况框。使用地面框,我将所有飞机图像块提取为正样本,并为输入创建变量。这是MATLAB代码:

Npos =  numel(p_regions);
Npos_train = floor(0.25*Npos); 
Npos_val = floor(0.25*Npos);
Npos_test = floor(0.50*Npos);

imdb.images.set =[ ones( 1, Npos_train ) 2*ones( 1, Npos_val) 3*ones( 1, Npos_test)];
for i=1:Npos
        im= imresize (double(p_regions{i,:}),[50,50]);
    imdb.images.data(:,:,:, i) = im;
    imdb.images.labels(i) = 1;
end
imdb.meta.sets = {'train', 'val', 'test'} ;

如果我结合飞机(正面)和非飞机(负面)图像补丁,那么代码会是这样的吗?

Npos_train = floor(0.25* (Npos+Nneg)); 
Npos_val = floor(0.25*(Npos+Nneg));
Npos_test = floor(0.50*(Npos+Nneg));
for i=1:Npos
            im= imresize (double(p_regions{i,:}),[50,50]);
        imdb.images.data(:,:,:, i) = im;
        imdb.images.labels(i) = 1;
    end
for i=1:Nneg
            im= imresize (double(n_regions{i,:}),[50,50]);
        imdb.images.data(:,:,:, I+Npos) = im;
        imdb.images.labels(I+Npos) = 0;
    end
imdb.images.set =[ ones( 1, Npos_train ) 2*ones( 1, Npos_val) 3*ones( 1, Npos_test)];

images.data就像 [All Positives All Negatives ]

images.labels将组织数据 [All 1's All 0's ]
和 images.set 将是 images.set =[ ones( 1, Npos_train ) 2*ones( 1, Npos_val) 3*ones( 1, Npos_test)];

问:这里让我感到困惑的是:如果我们想要 200 个样本进行训练。images.data那么如果数据存储在和中,CNN 将如何自动获取正负样本images.labels

4

1 回答 1

1

您应该自己验证这一点。在打印相应标签的同时采集数据样本并绘制图像。

即使我现在告诉您此代码是否正确,顺便说一句,我也不能这样做,因为我无法访问数据集,也无法尝试您的代码。但是,无论如何,您都必须能够验证您的数据,以验证您正在学习正确的东西。因此,我建议您自己验证。它将帮助您提高深度学习技能。

编辑:

数据数组的相同索引对应于标签数组中的相同索引。因此,如果一架飞机的标签为 0,它就知道它是假的,如果不是,它就知道它是真的。

网络实际上并不知道哪个标签对应于哪个动作,它只是学会区分这两个类别。我建议通过 mathconvnet 的教程(例如:http ://www.robots.ox.ac.uk/~vgg/practicals/cnn/index.html )来理解这些概念。

于 2017-01-18T08:34:03.830 回答