我将使用 fast-rcnn 为一个类训练我的数据集。我所有的图像都是 1920x1080 尺寸。我应该调整图像大小或裁剪图像,还是可以用这个大小进行训练?我的对象也非常小(大约 60x60)。
在配置文件中,尺寸写为 min_dimension: 600 和 max_dimension: 1024,因此我很困惑用 1920x1080 大小的图像训练模型。
我将使用 fast-rcnn 为一个类训练我的数据集。我所有的图像都是 1920x1080 尺寸。我应该调整图像大小或裁剪图像,还是可以用这个大小进行训练?我的对象也非常小(大约 60x60)。
在配置文件中,尺寸写为 min_dimension: 600 和 max_dimension: 1024,因此我很困惑用 1920x1080 大小的图像训练模型。
如果您的对象很小,将图像调整为更小的尺寸不是一个好主意。您可以将 max_dimension 更改为 1920 或 2000,这可能会使速度降低一些。为了裁剪图像,您应该首先考虑对象在图像中的放置方式。如果裁剪会剪切很多对象,那么您将遇到很多截断情况,这可能会对模型的性能产生负面影响。
如果你坚持使用faster-rcnn来应对这个任务,我个人推荐:
更改配置文件中的输入高度和宽度、最大值和最小值,这应该适用于您的数据集以成功执行。
将原始区域提案参数(也应该在配置文件中)更改为一定的比例和比例,如 1:1 和 60。
但如果我是你,我想尝试:
在主干中添加一些快捷方式,因为它是一个需要高分辨率特征的小目标检测任务。
切掉 fast-rcnn 头以提高性能,因为我只需要检测一个类是不是 THE 类(是背景还是其他类),并且输出应该足以在 RPN 阶段对信息进行编码.