我对简历很陌生,所以请原谅我的愚蠢问题......
我想要做什么:
我想在实时视频中识别一架 RC 飞机(目前它只是一个录制的视频)。
到目前为止我做了什么:
- 帧之间的差异
- 将其转换为灰度
- 高斯模糊
- 临界点
- 查找轮廓
以下是一些示例框架:
但是也有带噪点的帧,所以帧中的物体比较多。
我以为我可以做这样的事情:
对找到的每个轮廓使用一些对象识别算法。并且只计算每个边界矩形的特征向量。
是否可以仅针对图像的特定补丁(较小部分)计算 SURF/SIFT/...?
由于算法能够处理实时视频很重要,我认为只有在我不一直看整个图像的情况下才有可能?!或者可能决定例如是否有超过 10 个边界矩形,我检查整个图像而不是每个矩形。
然后我将查看下一帧并尝试将我的特征向量与前一帧匹配。这样我就可以追踪我的对象。一旦这些物体越过图片中间的红线,它将触发另一个事件。但这在这里并不重要。
我需要确保并非所有越过或在红线后面的物体都触发了该事件。因此,至少需要有 2 或 3 个包含该对象的连续帧,如果它越过,那么只有这样才应该触发事件。
物体识别算法有这么多变种,我有点不知所措。Sift/Surf/Orb/...你明白我在说什么。
谁能给我一个提示,我应该选择哪一个,或者我正在做的事情是否有意义?