我想使用 Tensorflow对象检测 API来识别一系列网络摄像头图像中的对象。在 COCO 数据集上预训练的Faster RCNN 模型似乎很合适,因为它们包含我需要的所有对象类别。
但是,我想提高模型在识别每个图像中相当小的对象时的性能。如果我理解正确,我需要编辑配置文件scales
中的锚参数以使模型使用更小的边界框。
我的问题是:
- 调整这个参数后,是否需要在整个 COCO 数据集上重新训练模型?或者有没有办法仅仅为了推理而改变模型并避免任何重新训练?
- 除了将图像裁剪成多个部分并分别对每个部分进行推理之外,还有其他成功识别小对象的提示/技巧吗?
背景资料
我目前正在为模型提供 1280x720 的图像。在大约 200x150 像素时,我发现很难检测到物体。