我正在做一个项目,我必须在移动环境中“实时”检测场景中的已知图片(这意味着我正在使用智能手机相机捕获帧并将帧大小调整为 150x225)。图片本身可能相当复杂。现在,我平均在 1.2 秒内处理每一帧(使用 OpenCV)。我正在寻找改善此处理时间和全局准确性的方法。我目前的实施工作如下:
- 捕获帧
- 将其转换为灰度
- 使用 ORB 检测关键点并提取描述符
- 匹配描述符(2NN)(对象->场景)并用比率测试过滤它们
- 匹配描述符(2NN)(场景->对象)并用比率测试过滤它们
- 使用 4. 和 5. 去除非对称匹配。
- 计算匹配置信度(匹配关键点占总关键点的百分比)
我的方法可能不是正确的,但结果还可以,尽管还有很大的改进空间。我已经注意到 SURF 提取太慢了,我无法使用单应性(它可能与 ORB 有关)。欢迎所有建议!