0

我正在训练 Faster R-CNN 从无人机摄影中检测小物体:25x25 到 30x30 像素。到目前为止,我已经使用 .config 文件中给出的默认锚点尺寸完成了这项工作:

first_stage_anchor_generator {
      grid_anchor_generator {
        height_stride: 16
        width_stride: 16
        scales: 0.25
        scales: 0.5
        scales: 1.0
        scales: 2.0
        aspect_ratios: 0.5
        aspect_ratios: 1.0
        aspect_ratios: 2.0

但是,我在文献中读到以下内容:

原始的 Faster-RCNN 模型参数是在使用前视图数据集获取的数据集上训练的,因此我们通过将锚点的大小减小到 (8, 16, 32, 64, 128) 来重新训练模型,以更好地拟合俯视无人机图像。网络及其修改的这种组合显着提高了模型在我们数据集上的准确性和召回率。

我已经通过网站阅读了很多内容,但仍然无法确定我应该修改哪些参数以将锚大小调整为文献建议的大小(8、16、32、64、128)。

任何帮助将不胜感激!

4

1 回答 1

0

您可以在 grid_anchor_generator.proto 中找到网格锚生成器的默认值。如下图所示

message GridAnchorGenerator {
   // Anchor height in pixels.
  optional int32 height = 1 [default = 256];

  // Anchor width in pixels.
  optional int32 width = 2 [default = 256];

我认为,将以下参数添加到更快的 r-cnn 配置文件将解决您的问题。

first_stage_anchor_generator {
      grid_anchor_generator {
        scales: [1.0, 2.0 , 3.0 , 4.0 , 5.0 , 6.0 ]
        aspect_ratios: [0.5, 1.0, 2.0]
        height_stride: 16
        width_stride: 16
        height: 8 # or you can change any value you desired (default = 256)
        width: 8 # or you can change any value you desired (default = 256)
      }
    }
于 2021-09-08T12:42:44.673 回答