众所周知,我们可以tensor
通过padding mode for来计算输出的形状conv2d
,算法很清楚,但是我很困惑conv2d_transpose
,它是否填充输入张量然后调用conv2d
?它在哪里转置过滤器或输入?如何根据填充模式计算输出张量的形状,SAME
或者VALID
为conv2d_transpose
?
问问题
437 次
1 回答
1
填充对 conv2d_transpose 意味着什么?
'SAME'意味着简单地将输入形状乘以步幅。例如,如果输入形状的高度和宽度为 7,而 conv2d_transpose 的 padding=same 和 strides=3,那么输出形状的高度和宽度将为 7x3 = 21。
“有效”几乎相同。从“SAME”开始,然后检查 kernel_size 与步幅的比较。如果它更大,则将该数量添加到高度和宽度。为什么?因为当内核在图像上移动以进行卷积时(一次通过罢工量),最后一个内核将通过差异悬在图像上。想象上面的例子,高度和宽度为 7 作为输入,这次 padding=valid,strides=3,kernel=5。输出高度和宽度将为 7x3 + (5-3)。
在这两种情况下,如果内核小于步幅,您只会在输出中得到很多零。为什么?考虑一下 stride 的作用...
对于给定的步幅值,输入图像会增加很多倍。步幅为 3 使输入图像宽和高 3 倍。原始值占据第三个位置,其余的用零填充!对于 padding=valid,还有我们之前讨论过的额外内容。
kernel_size 是在图像上进行卷积的内核的大小,它在图像上按步长移动。因此,如果 kernel_size 为 1 且步幅为 3,那么您的输出大部分为零。
示例相同
>>> conv2d_tr = tf.keras.layers.Conv2DTranspose(5,kernel_size=3,padding='same',strides=2)
>>> conv2d_tr(np.zeros([3,2,2,4],dtype=np.float32)).numpy().shape
(3, 4, 4, 5)
示例 VALID(比 strides 更大的内核)
>>> conv2d_tr = tf.keras.layers.Conv2DTranspose(5,kernel_size=3,padding='valid',strides=2)
>>> conv2d_tr(np.zeros([3,10,10,4],dtype=np.float32)).numpy().shape
(3, 21, 21, 5)
示例 VALID(内核等于或小于步幅)
>>> conv2d_tr = tf.keras.layers.Conv2DTranspose(5,kernel_size=2,padding='valid',strides=2)
>>> conv2d_tr(np.zeros([3,2,2,4],dtype=np.float32)).numpy().shape
(3, 20, 20, 5)
小内核跨步的示例零
>>> conv2d_tr = tf.keras.layers.Conv2DTranspose(1,kernel_size=1,padding='same',strides=2)
>>> conv2d_tr(np.ones([1,2,2,3],dtype=np.float32)).numpy().shape
(1, 4, 4, 1)
>>> conv2d_tr(np.ones([1,2,2,3],dtype=np.float32)).numpy()
array([[[[0.702],[0. ],[0.702],[0. ]],
[[0. ],[0. ],[0. ],[0. ]],
[[0.702],[0. ],[0.702],[0. ]],
[[0. ],[0. ],[0. ],[0. ]]]], dtype=float32)
于 2020-11-24T02:05:27.767 回答