在“用于语义分割的完全卷积网络”一文中,作者区分了反卷积上下文中的输入步幅和输出步幅。这些术语有何不同?
问问题
5544 次
1 回答
13
输入步幅是滤波器的步幅。你在输出中移动了多少过滤器。
Output Stride这实际上是一个标称值。在进行了几次卷积、最大池化操作后,我们在 CNN 中得到了特征图。假设我们的输入图像是224 * 224 并且我们的最终特征图是7*7。
然后我们说我们的输出步幅是:224/7 = 32(下采样后图像发生的近似值。)
这个 tensorflow脚本描述了这个输出步幅是什么,以及如何在 FCN 中使用,这是密集预测的情况。
一种使用空间维度为 32 加 1 的倍数的输入,例如 [321, 321]。在这种情况下,ResNet 输出的特征图将具有空间形状 [(height - 1) / output_stride + 1, (width - 1) / output_stride + 1] 并且角点与输入图像角点完全对齐,这极大地方便了对齐图像的特征。使用 [225, 225] 图像作为输入会在最后一个 ResNet 块的输出处产生 [8, 8] 特征图。
于 2017-07-27T06:24:28.167 回答