在卷积神经网络 (CNN) 中,选择一个过滤器用于权重共享。例如,在下图中,选择了步幅(相邻神经元之间的距离)为 1 的 3x3 窗口。
所以我的问题是:如何选择窗口大小?如果我使用步幅为 2 的 4x4,它会造成多大的差异?提前非常感谢!
在卷积神经网络 (CNN) 中,选择一个过滤器用于权重共享。例如,在下图中,选择了步幅(相邻神经元之间的距离)为 1 的 3x3 窗口。
所以我的问题是:如何选择窗口大小?如果我使用步幅为 2 的 4x4,它会造成多大的差异?提前非常感谢!
对此没有明确的答案:过滤器大小是您通常需要调整的超参数之一。但是,有一些有用的观察结果可能会对您有所帮助。通常首选较小的过滤器,但数量较多。
示例:四个5x5
过滤器有 100 个参数(忽略偏差),而 10 个3x3
过滤器有 90 个参数。通过较大的过滤器,您仍然可以捕获图像中的各种特征,但参数较少。更多关于这个here。
现代 CNN 在这个想法上走得更远,并选择连续3x1
和1x3
卷积层。这进一步减少了参数的数量,但不影响性能。参见初始网络的演变。
步幅的选择也很重要,但它会影响卷积后的张量形状,从而影响整个网络。一般规则是stride=1
在通常的卷积中使用并通过填充保留空间大小,并stride=2
在您想要对图像进行下采样时使用。