deep-learning - 为什么 fast-rcnn ssd 使用 3x3 过滤器来预测框位置和类标签？

翻译自：https://stackoverflow.com/questions/55584228 2019-04-09T02:24:11.040

245 次

0

我正在阅读用于对象检测的 fast-rcnn 和 ssd 代码。预测层使用 3x3 过滤器来预测框位置和类标签。

为什么不使用 2x2 过滤器或 4x4 过滤器或 5x5 过滤器来预测它们？

1 回答 1

0

这只是一个超参数的选择。这样的选择可以通过超参数搜索的交叉验证来做出，这意味着用不同的超参数选择训练几个模型，看看谁在验证集上获得了最好的性能。特别是对于 3x3 卷积，自从VGG 论文提出堆叠许多 3x3 卷积（被认为是一个小内核）可以提供良好的性能以来，这已经变得流行起来。

于 2019-04-11T11:59:42.287 回答