1

我正在尝试使用单输出训练 MNIST 数据集。这意味着当我给一个 28*28 的输入(图像)时,模型给了我们一个公正的数字。例如我给'5',模型给我的结果是4.9、5、5.002或接近5。所以我有一些文件是红色的。人们告诉softmaxlayer必须用回归层来改变。为了这样做。我正在使用 matconvnet 库及其 mnist 示例。我已经改变了我的网络并编写了回归层损失函数。这些是我的代码:

net.layers = {} ;
net.layers{end+1} = struct('type', 'conv', ...
                           'weights', {{f*randn(5,5,1,20, 'single'), zeros(1, 20, 'single')}}, ...
                           'stride', 1, ...
                           'pad', 0) ;
net.layers{end+1} = struct('type', 'pool', ...
                           'method', 'max', ...
                           'pool', [2 2], ...
                           'stride', 2, ...
                           'pad', 0) ;
net.layers{end+1} = struct('type', 'conv', ...
                           'weights', {{f*randn(5,5,20,50, 'single'),zeros(1,50,'single')}}, ...
                           'stride', 1, ...
                           'pad', 0) ;
net.layers{end+1} = struct('type', 'pool', ...
                           'method', 'max', ...
                           'pool', [2 2], ...
                           'stride', 2, ...
                           'pad', 0) ;
net.layers{end+1} = struct('type', 'conv', ...
                           'weights', {{f*randn(4,4,50,500, 'single'),  zeros(1,500,'single')}}, ...
                           'stride', 1, ...
                           'pad', 0) ;
net.layers{end+1} = struct('type', 'relu') ;
net.layers{end+1} = struct('type', 'conv', ...
                           'weights', {{f*randn(1,1,500,1, 'single'), zeros(1,1,'single')}}, ...
                           'stride', 1, ...
                           'pad', 0) ;                         
 net.layers{end+1} = struct('type', 'normloss');

这是回归损失函数:

function Y = vl_normloss(X,c,dzdy)
size(X)%1 1 1 100
size(c)%1 100

if nargin <= 2

Y = 0.5*sum((squeeze(X)'-c).^2);
size(Y)%1 1
Y      % 1.7361e+03
else
size(Y)
Y = +((squeeze(X)'-c))*dzdy;
Y = reshape(Y,size(X));
end

我更改opts.errorFunction = 'multiclass' ;'none' 另外我添加

case 'normloss'
      res(i+1).x = vl_normloss(res(i).x,l.class) ;

到 vl_simplenn 脚本

但是当我运行火车时会发生此错误

错误使用 vl_nnconv DEROUTPUT 维度与 X 和 FILTERS 不兼容。

vl_simplenn 中的错误(第 415 行)[res(i).dzdx, dzdw{1}, dzdw{2}] = ...

我必须做些什么来解决这个问题?谢谢你

4

2 回答 2

0

我找到了解决方案。我犯了一个错误。vl_simplenn 脚本中有 2 行需要更改,但我只更改了一行。此代码有效。

于 2016-12-28T07:11:04.040 回答
0

我有个问题。

net.layers{end+1} = struct('type', 'conv', ...
                           'weights', {{f*randn(1,1,500,1, 'single'), zeros(1,1,'single')}}, ...
                           'stride', 1, ...
                           'pad', 0) ;                         
 net.layers{end+1} = struct('type', 'normloss');

在 conv 层输出 [1 1 500 1] 显示 1x500? 在损失层你如何使用那个值?损失层softmax不应该预测类概率然后找到最高概率对应的类吗?或者在这种情况下 [1 1 500 1] 的输出是概率?

于 2017-05-04T04:34:21.543 回答