0

我有一个像这样的 3 通道 5×5 图像:

1 1 1 1 1    2 2 2 2 2    3 3 3 3 3
1 1 1 1 1    2 2 2 2 2    3 3 3 3 3
1 1 1 1 1    2 2 2 2 2    3 3 3 3 3
1 1 1 1 1    2 2 2 2 2    3 3 3 3 3
1 1 1 1 1    2 2 2 2 2    3 3 3 3 3

还有一个像这样的 3 通道 3×3 过滤器:

10 20 30   0.1 0.2 0.3   1 2 3
40 50 60   0.4 0.5 0.6   4 5 6
70 80 90   0.7 0.8 0.9   7 8 9

当将图像与过滤器进行卷积时,我期待这个输出:

369.6  514.8  316.8
435.6  594.   356.4
211.2  277.2  158.4

但是,Theano(使用 keras)给了我这个输出:

158.4   277.2  211.2
356.4   594.   435.6 
316.8   514.8  369.6

输出似乎旋转了 180 度,我想知道为什么会发生这种情况,我怎样才能得到正确的答案。这是我的测试代码:

def SimpleNet(weight_array,biases_array):
    model = Sequential()
    model.add(ZeroPadding2D(padding=(1,1),input_shape=(3,5,5)))
    model.add(Convolution2D(1, 3, 3, weights=[weight_array,biases_array],border_mode='valid',subsample=(2,2)))

    return model
im = np.asarray([
        1,1,1,1,1,
        1,1,1,1,1,
        1,1,1,1,1,
        1,1,1,1,1,
        1,1,1,1,1,
        2,2,2,2,2,
        2,2,2,2,2,
        2,2,2,2,2,
        2,2,2,2,2,
        2,2,2,2,2,
        3,3,3,3,3,
        3,3,3,3,3,
        3,3,3,3,3,
        3,3,3,3,3,
        3,3,3,3,3])

weight_array = np.asarray([
                10,20,30,
                40,50,60,
                70,80,90,
                0.1,0.2,0.3,
                0.4,0.5,0.6,
                0.7,0.8,0.9,
                1,2,3,
                4,5,6,
                7,8,9])

im = np.reshape(im,[1,3,5,5])
weight_array = np.reshape(weight_array,[1,3,3,3])
biases_array = np.zeros(1)

model = SimpleNet(weight_array,biases_array)

sgd = SGD(lr=0.1, decay=1e-6, momentum=0.9, nesterov=True)
model.compile(optimizer=sgd, loss='categorical_crossentropy')
out = model.predict(im)
print out.shape
print out
4

1 回答 1

1

这就是卷积的定义。它的优点是,如果您对仅由零组成的图像进行卷积,除了某个地方的单个 1,卷积将在该位置放置一个过滤器的副本。

Theano 完全按照数学上的定义进行这些卷积。filter[:, :, ::-1, ::-1]这意味着在使用图像补丁获取点积之前翻转过滤器(操作是)。请注意,这些不是 180 度的旋转,至少在一般情况下不是。

看来您正在寻找的是互相关,它在图像的每个点上使用非翻转版本的过滤器进行点积。

另请参阅此答案,其中theano.tensor.nnet.conv2d显示与对应物完全相同scipy

于 2016-01-13T09:10:30.353 回答