我目前正在为我正在建造的无人机开发视觉系统。该系统的目标是在视频流中找到定义相当明确(见下文)的目标对象,该视频流将是地面的二维飞越视图。到目前为止,我已经尝试过训练并使用基于 Haar 特征的级联(la Viola Jones)来进行检测。我正在使用 5000 多张不同角度(透视偏移)和范围(框架中的大小)的目标图像进行训练,但只有 1900 张“背景”图像。这根本不会产生好的结果,因为我找不到合适数量的级联级联来平衡少量误报和少量误报。
我正在向在这方面有经验的人寻求建议,关于我是否应该:1)放弃级联,转而采用更适合由其轮廓和颜色定义的对象的东西(我读过 VJ 级联是不是)。2)改进我的级联训练集,或者通过添加正面、背景帧、更好地组织/拍摄它们等。3)我目前无法理解的其他一些方法。
目标描述:
- 主要形状:三角形、正方形、圆形、椭圆形等。
- 不同的、纯色的、原色(或接近)的颜色。
- 最小尺寸在 2 到 8 英尺之间(大到足以从几百英尺的 AGL 上轻松看到)
- 对象中心的大而单一的字母数字,具有自己独特的、纯色、原色或几乎原色。
我的目标是使用非常快速的东西,例如 VJ 级联,来找到可能的对象及其相关的边界框,然后将它们传递给更精细的处理例程以确定属性(对象的颜色和 AN,AN 的值,实际形状和 GPS 位置)。您可以为我完成此目标提供的任何建议将不胜感激。我目前拥有的源代码在这里发布有点长,但如果您想查看它以供参考,可以免费获得。提前致谢!
-JB