Tensorflow 在github上有 resnet 的官方实现。它使用固定填充而不是普通的 tf.layers.conv2d。
像这样的东西:
def conv2d_fixed_padding(inputs, filters, kernel_size, strides, data_format):
"""Strided 2-D convolution with explicit padding."""
# The padding is consistent and is based only on `kernel_size`, not on the
# dimensions of `inputs` (as opposed to using `tf.layers.conv2d` alone).
if strides > 1:
inputs = fixed_padding(inputs, kernel_size, data_format)
return tf.layers.conv2d(
inputs=inputs, filters=filters, kernel_size=kernel_size, strides=strides,
padding=('SAME' if strides == 1 else 'VALID'), use_bias=False,
kernel_initializer=tf.variance_scaling_initializer(),
data_format=data_format)
这样做的目的是什么?如果我们输入一个大小为 32x32 的图像并使用 tf.layer.conv2d 将填充方法设置为 SAME,步长 2,我们可以获得一个 16x16 的特征图。但在上面的代码中,它将在图像的两侧填充零,然后使用填充方法有效。