我已经开始使用 LabelImg 工具和绘图框进行注释,但是图像中的图片太多(例如图像中有很多葡萄)。对于训练有素的模型,是否需要将所有图片装箱,还是可以留下一些?
我正在尝试训练更快的 RCNN 模型。
我已经开始使用 LabelImg 工具和绘图框进行注释,但是图像中的图片太多(例如图像中有很多葡萄)。对于训练有素的模型,是否需要将所有图片装箱,还是可以留下一些?
我正在尝试训练更快的 RCNN 模型。
我认为只要它不会变得太小bbox
并且在视觉上可以被人类识别,或者可以在其中获得特征 - 就可以了。
例如,让我们考虑以下情况,数据集包含这样无意义的注释(红色标记),通常工程师会跳过那些边界框 ( box['w'] * box['h']
) < 某个阈值。