5

嗨,我是图像处理领域的新手。我的项目是对图像/视频中的对象进行分类。输入是来自监控摄像头的图像/视频。我应该将对象分为三类。1) 人类 2) 动物 3) 其他(汽车)。我们可以考虑一个固定的背景。

任何人都可以为此目的提出任何经过验证的算法或论文或开源代码吗?谷歌搜索是显而易见的解决方案,但经验丰富的眼睛总是有帮助的!

4

1 回答 1

13

出于您的目的,我认为最好的选择是LatSVM,因为作者将 MATLAB 中的实现和已经训练的检测器模型分开。已经训练好的模型包括:

  • 飞机, 船, 巴士, 汽车, 自行车
  • 奶瓶、电视、沙发
  • 鸟, 猫, 马, 羊, 狗
  • 等等

如果您需要,OpenCV 中也有一个实现(在这个问题中找到)。

其他检测器实现


看看行人检测中的以下调查:

  1. 行人检测:最新技术评估(2012 年)。
  2. 高级驾驶辅助系统行人检测调查 (2010)。

最先进的

  • 每秒 100 帧的行人检测。这项工作由 [Benenson等人提出。, 2012] 以最先进的精度实现了高检测速度[网页]。
  • 使用基于判别训练的基于部件的模型进行目标检测(又名LatSVM)在 PASCAL 2006、2007 和 2008 上取得了良好的效果。这项工作不仅适用于行人检测,还适用于汽车、猫、马、沙发。你真的应该看看这个[网页]
  • 使用偏最小二乘分析的人体检测。[Schwartz et al., 2009]提出使用偏最小二乘分析,它允许处理高维空间特征。

古典作品

以下工作具有重要贡献,是行人检测每项工作的参考。HOG 特征、积分图像和拒绝级联被几部作品使用,包括 [Benenson等人的作品。, 2012]。

  • 用于人体检测的定向梯度直方图
  • 使用方向梯度直方图的级联快速人体检测
于 2012-10-22T14:45:56.063 回答