我有一个项目需要检测类似动漫风格的视频中的人
我刚刚在 GTX 1050TI 中用 COCO 测试了 YOLOv3 608x608
但是速度只有约 1.5FPS 左右,但我的项目在 1050TI 上至少需要 10 FPS
1.我想知道类数会影响检测速度吗?(我假设 COCO 是要在图片中找到 80 种物体?如果我只需要找到一种物体,它会快 80 倍吗?)
2.当我输入图像进行训练时,原始图像是1920*1080,我应该在标记和训练之前将它们调整为608x608吗?
3.我应该使用任何标记工具吗?在https://github.com/AlexeyAB/darknet <x> <y> <width> <height>
的 README.md 中似乎需要手动计算和输入,这似乎太难了,也许有一个工具我只需要裁剪对象在图像中的位置?
4.如果物体不是图像中的正方形,YOLO怎么知道哪个部分是物体?如何避免将背景训练为对象?
我是否必须删除所有背景并将其填充为黑色,仅将对象保留在图像中?
5.输出总是一个盒子吗?我可以训练并获得输出作为掩码吗?如果我检测为掩码,它会比盒子慢吗,因为它似乎有更多信息?
6.要获得好的结果,我应该制作多少个训练图像和测试图像?
我知道这只是简历中的一些菜鸟问题,但是我真的很想知道这一点,而无需花费数周的时间进行培训并自己找出答案,我们将不胜感激!