1

例如,我们有 3 个通道(红、绿、蓝)的 RGB 图像。我们使用卷积神经网络。

对于图像的每个通道(R,G,B),每个卷积滤波器是否总是具有 3 个不同的系数?

  1. 即filter-W1是否有3个不同的系数矩阵:W1[::0], W1[::1], W1[::2]如下图所示?

  2. 还是在现代神经网络中的一个滤波器中经常使用相同的系数(W1[::0] = W1[::1] = W1[::2])?

在此处输入图像描述

通过链接获取:http ://cs231n.github.io/convolutional-networks/


另外:http ://cs231n.github.io/convolutional-networks/#conv

卷积层

...

沿深度轴的连接程度始终等于输入体积的深度。再次强调我们如何处理空间维度(宽度和高度)和深度维度的这种不对称性很重要:连接在空间中是局部的(沿着宽度和高度),但总是沿着输入体积的整个深度充满

4

1 回答 1

1

这里表示的是第一个隐藏层(这里是卷积层)。每个过滤器都有 3 个通道,因为您的输入(对于这一层的图像)有 3 个通道 (RGB)。导致您连接的 2 个特征图(这解释了 (3x3)x2 大小的输出体积)。

更一般地说,对于大小为 (1x)WxHxC 的输入(为简单起见,让我们考虑批量大小为 1),每个过滤器的大小将为 NxNxC(为简单起见,让我们考虑步幅为 1 和“相同”填充,即使对于您的示例,它是“有效”填充),因此对于 F 过滤器,您的输出将具有 (1x)WxHxF 的大小。

希望它足够清楚(例如 W = H = 7,C = 3,N = 3 和 F = 2)。

如果不够清楚,请随时发表评论:)

于 2017-05-30T08:29:26.433 回答