0

我正在阅读用于对象检测的 fast-rcnn 和 ssd 代码。预测层使用 3x3 过滤器来预测框位置和类标签。

为什么不使用 2x2 过滤器或 4x4 过滤器或 5x5 过滤器来预测它们?

在此处输入图像描述

4

1 回答 1

0

这只是一个超参数的选择。这样的选择可以通过超参数搜索的交叉验证来做出,这意味着用不同的超参数选择训练几个模型,看看谁在验证集上获得了最好的性能。特别是对于 3x3 卷积,自从VGG 论文提出堆叠许多 3x3 卷积(被认为是一个小内核)可以提供良好的性能以来,这已经变得流行起来。

于 2019-04-11T11:59:42.287 回答