最大池在视觉中很有用,原因有两个:
通过消除非最大值,它减少了上层的计算。
它提供了一种平移不变性。想象一下将一个最大池化层与一个卷积层级联起来。有 8 个方向可以将输入图像平移一个像素。如果在 2x2 区域上进行最大池化,则这 8 种可能配置中的 3 种将在卷积层产生完全相同的输出。对于 3x3 窗口上的最大池化,这会跳转到 5/8。
由于它为位置提供了额外的鲁棒性,因此最大池化是一种减少中间表示维数的“智能”方式。
看不懂,什么8 directions
意思?什么
“如果在 2x2 区域上进行最大池化,则这 8 种可能配置中的 3 种将在卷积层产生完全相同的输出。对于 3x3 窗口上的最大池化,这将跳转到 5/8。”
意思是?