0

我将使用 fast-rcnn 为一个类训练我的数据集。我所有的图像都是 1920x1080 尺寸。我应该调整图像大小或裁剪图像,还是可以用这个大小进行训练?我的对象也非常小(大约 60x60)。

在配置文件中,尺寸写为 min_dimension: 600 和 max_dimension: 1024,因此我很困惑用 1920x1080 大小的图像训练模型。

4

2 回答 2

1

如果您的对象很小,将图像调整为更小的尺寸不是一个好主意。您可以将 max_dimension 更改为 1920 或 2000,这可能会使速度降低一些。为了裁剪图像,您应该首先考虑对象在图像中的放置方式。如果裁剪会剪切很多对象,那么您将遇到很多截断情况,这可能会对模型的性能产生负面影响。

于 2019-09-09T15:29:25.890 回答
0

如果你坚持使用faster-rcnn来应对这个任务,我个人推荐:

  1. 更改配置文件中的输入高度和宽度、最大值和最小值,这应该适用于您的数据集以成功执行。

  2. 将原始区域提案参数(也应该在配置文件中)更改为一定的比例和比例,如 1:1 和 60。

但如果我是你,我想尝试:

  1. 在主干中添加一些快捷方式,因为它是一个需要高分辨率特征的小目标检测任务。

  2. 切掉 fast-rcnn 头以提高性能,因为我只需要检测一个类是不是 THE 类(是背景还是其他类),并且输出应该足以在 RPN 阶段对信息进行编码.

于 2019-09-11T16:31:31.587 回答