6

我正在尝试理解 Viola Jones 的方法,而且我基本上已经掌握了。

它使用简单的类似 Haar 的特征被提升为强分类器并组织成层/级联以实现更好的性能(不打扰明显的“非对象”区域)。

我想我了解积分图像,并且了解特征的计算值是如何计算的。

我唯一想不通的是算法如何处理面部大小的变化。

据我所知,他们使用在图像上滑动的 24x24 子窗口,其中算法通过分类器并试图找出上面是否有人脸/物体。

我的问题是——如果一张脸是 10x10 大小,而另一张脸是 100x100 怎么办?那会发生什么?

而且我很想知道前两个特征是什么(在级联的第一层),它们看起来如何(记住这两个特征,根据 Viola&Jones 的说法,几乎不会错过一张脸,并且会消除60% 的错误) ? 如何??

而且,如何构建这些特征来处理图像中不同人脸尺寸的这些统计数据?

我是否遗漏了什么,或者我认为这一切都错了?

如果我不够清楚,我会尝试更好地解释我的困惑。

4

1 回答 1

6

训练

Viola-Jones 分类器在 24*24 图像上进行训练。每个人脸图像都包含一个类似比例的人脸。这会生成一组特征检测器,这些特征检测器由两个、三个或四个针对特定尺寸的面部优化的矩形组成。

脸型

通过在不同尺度上重复分类来检测不同的人脸尺寸。原始论文指出,通过将不同的比例相隔 1.25 倍,可以获得良好的结果。

请注意,积分图像意味着很容易通过简单地缩放矩形角的坐标来计算任何比例的矩形特征。

最好的功能

原始论文包含在典型级联中选择的前两个特征的图片(参见第 4 页)。

第一个特征检测在脸颊较亮的较宽矩形上方的眼睛较宽的深色矩形。

----------
----------
++++++++++
++++++++++

第二个特征检测鼻梁的明亮薄矩形,位于包含眼睛的两侧较暗的矩形之间。

---+++---
---+++---
---+++---
于 2012-09-02T19:02:21.663 回答