0

我想在自定义数据集上使用 Mobilenet SSD 模型训练对象检测器。

查看 Mobilenet 的配置文件,有一个名为 image_resizer{} 的块,我认为默认为 300x300,但我可用的图像为 224x224。

我可以在不更改配置文件的情况下进行培训,还是真的需要将其更改为 224x224 以匹配我的图像?

在这里找到配置文件。

https://github.com/tensorflow/models/blob/d6d0868209833e014074d6cb4f32558e7acf2a6d/research/object_detection/samples/configs/ssd_mobilenet_v1_pets.config#L43

4

1 回答 1

0

图像调整器是一个固定的调整大小 - 因此,如果您使用默认 (300x300) 进行暂存 - 图像在传递到网络之前将被调整为 300x300。

要记住的一件事是您在此模型中拥有的默认分支数 - 为 6 - 当您从 300x300 输入开始时,最终分支将为 1x1,如果您决定更改输入大小,您可能还需要更新分支的数量(也就是配置中的 num_layers)——因为只有 5 个分支的空间(如果你不改变它们的拱门。)——你实际上在 5 个分支之后达到了 1x1。
更清楚的是,您将从 224x224 开始拥有的分支

  1. 分支 0 - 图像的 1/16 - 14x14
  2. 分支 1 - 图像的 1/32 - 7x7
  3. 分支 2 - 图像的 1/32 - 4x4
  4. 分支 3 - 图像的 1/32 - 2x2
  5. 分支 4 - 图像的 1/32 - 1x1
于 2021-05-25T04:11:09.097 回答