问题标签 [max-pooling]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
computer-vision - Indices out of range for MaxUnpool2d
I am trying to understand unpooling in Pytorch because I want to build a convolutional auto-encoder.
I have the following code
But I am constantly getting this error on the last line (unpooling).
Although the data is simulated in this example, the input has to be of that shape because of the preprocessing that has to be done.
I am fairly new to convolutional networks, but I have even tried using a ReLU and convolutional 2D layer before the pooling however, the indices always seem to be incorrect when unpooling for this shape.
python - MaxPooling2D 的语法不正确,我找不到
我正在尝试为 cifar-10 数据集创建一个简单的分类模型。模型在达到 Maxpooling 功能时失败。它说它的语法不正确,但对于我的生活,我无法弄清楚什么是错的。
它是我正在使用的 keras 版本吗?当我将 maxpooling 添加到大小为 2、2 的模型中时,它不起作用,在文档中,我正在做完全相同的事情,这让我认为这是一个版本问题。
抱歉,如果问题很明显
python - 使用“tf.nn.avg_pool”在张量流中最大池化单个图像
我想在单个图像上应用“tf.nn.max_pool()”,但我得到的结果与输入的尺寸完全不同:
我认为这与尝试将池应用于单个示例而不是批处理有关。我需要对单个示例进行池化。
任何帮助表示赞赏。
python - 如何在 PyTorch 中稳定 TransposedConv2d 的输出大小
我有一个用 PyTorch 编写的编码器-解码器回归网络,它将 RGB 图像作为输入。输出是一个 2D 图像,应该与输入具有相同的大小。
对于我使用 224x224 大小的 rgb 补丁的基于补丁的分析,一切正常。但是当涉及到可变大小的输入(例如 681x1024 或 777x900)时,事情开始变得混乱。因为输出大小几乎总是不等于输入大小,这阻碍了我实现我想要的结构。原因如下:
假设我想建立一个像上面这样的多分支混合融合网络(取自本文)。在这个网络中,全局分支的输出之一成为本地分支输入的一部分。换句话说,GUIDANCE MAP 的大小应该等于 LIDAR 图像。
现在,我的意图是使用可变大小的输入来实现相同的功能。我的两个分支有结构
当我需要融合它们的输出时,它们可以正常工作,因为它们的输出具有相同的大小。但是当我想将输入图像与全局网络的输出融合时,我得到了
我知道这些大小变化是由于 TransposedConv2d 函数无法以精确的精度恢复 MaxPool2d 降低的分辨率。但我想知道是否有办法显式动态地恢复大小。
TLDR;我想使用 TransposedConv2d 恢复 MaxPool2d 降低的图像分辨率,用于大小不均匀的输入,例如 681x1024 或 777x900。
我感谢任何帮助或建议。
machine-learning - covolution2d 和 maxpolling2d 如何应用于 Keras 的输入?
我对我将要谈论的所有内容都很陌生,所以问题可能太简单了。
提前感谢您的回答!
为了更清楚:
对于第一个卷积,从
1 x 28 x28
到25 x 26 x26
,输入(1 层)通过过滤器(25 层)。因此,一层过滤了 25 次(对吗?)。
但是对于第二个卷积,从25 x 13 x 13
到,应用于输入50 x 11 x 11
的过滤器的操作是什么?我对手术感到困惑。因为如果输入的每一层都经过过滤器,输出应该是。为什么输出还是50层?50 x 3 x 3
25 x 13 x 13
1250 x 11 x 11
25 x 13 x 13
50 x 3 x 3
对于第二个Max Pooling,如何
MaxPooling2D()
处理奇数大小的层?余数(11 mod 2)
为1
。在上图中,从11
到5
,发生了1
什么?
另外,最大池化奇数输入层的常见操作是什么?
python-3.x - 为什么 keras.backend.pool3d 要求 tensor_in 是 5 维的?
我有以下代码
当我尝试运行它说的代码时
.. InvalidArgumentError: tensor_in 必须是 5 维 [Op:AvgPool3D] 名称:AvgPool3D/
我似乎不喜欢 yt 的维度。但我想在尺寸为 3x3x3 的 3d 图像中最大化池。另一个维度应该是什么?
tensorflow - 如何在 keras / tensorflow 中使用相同的平均池化处理不均匀的输入
与这个问题非常相似,但用于平均池化。
公认的答案说,相同的池使用 -inf 作为 maxpooling 的填充。但是什么用于平均池化。他们只使用0吗?
conv-neural-network - MaxPooling 会减少过拟合吗?
我用较小的数据集训练了以下 CNN 模型,因此它会过度拟合:
该模型有很多可训练的参数(超过 300 万,这就是为什么我想知道我是否应该使用额外的 MaxPooling 来减少参数数量,如下所示?
Conv - BN - Act - MaxPooling - Conv - BN - Act - MaxPooling - Dropout - Flatten
或者像下面这样额外的 MaxPooling 和 Dropout?
Conv - BN - Act - MaxPooling - Dropout - Conv - BN - Act - MaxPooling - Dropout - Flatten
我试图理解 MaxPooling 的全部意义以及它是否有助于防止过度拟合。
deep-learning - 在 PyTorch 的“MaxPool2D”中,是否根据“ceil_mode”添加填充?
默认情况MaxPool2D
下,填充设置为 0,并且ceil_mode
也设置为False
. 现在,如果我有一个大小的输入,7x7
输出kernel=2,stride=2
形状变为3x3
,但是当我使用 时ceil_mode=True
,它变为4x4
,这是有道理的,因为(如果以下公式正确),因为7x7
withoutput_shape
将是3.5x3.5
并且取决于ceil_mode
它会是3x3
or 4x4
。
现在,我的问题是,如果ceil_mode=True
,它会改变默认值padding
吗?
如果是这样,那么它是如何添加填充的,即它是在左边还是右边添加填充,首先是向上还是向下?