12

我想使用 Tensorflow对象检测 API来识别一系列网络摄像头图像中的对象。在 COCO 数据集上预训练的Faster RCNN 模型似乎很合适,因为它们包含我需要的所有对象类别。

但是,我想提高模型在识别每个图像中相当小的对象时的性能。如果我理解正确,我需要编辑配置文件scales中的锚参数以使模型使用更小的边界框。

我的问题是:

  • 调整这个参数后,是否需要在整个 COCO 数据集上重新训练模型?或者有没有办法仅仅为了推理而改变模型并避免任何重新训练?
  • 除了将图像裁剪成多个部分并分别对每个部分进行推理之外,还有其他成功识别小对象的提示/技巧吗?

背景资料

我目前正在为模型提供 1280x720 的图像。在大约 200x150 像素时,我发现很难检测到物体。

4

1 回答 1

7
  1. 不幸的是,您需要完全重新训练,因为权重确实取决于锚的形状。

  2. 拥有更高分辨率的特征图应该会有所帮助(但会减慢过程),因此更改特征提取器以获得输入尺寸减少较少的特征图(步幅 > 1 的最大池通常会减少空间大小)或放大图像 a初始图像缩放器中的位。

于 2018-01-16T09:32:13.793 回答