我正在尝试理解 Viola Jones 的方法,而且我基本上已经掌握了。
它使用简单的类似 Haar 的特征被提升为强分类器并组织成层/级联以实现更好的性能(不打扰明显的“非对象”区域)。
我想我了解积分图像,并且了解特征的计算值是如何计算的。
我唯一想不通的是算法如何处理面部大小的变化。
据我所知,他们使用在图像上滑动的 24x24 子窗口,其中算法通过分类器并试图找出上面是否有人脸/物体。
我的问题是——如果一张脸是 10x10 大小,而另一张脸是 100x100 怎么办?那会发生什么?
而且我很想知道前两个特征是什么(在级联的第一层),它们看起来如何(记住这两个特征,根据 Viola&Jones 的说法,几乎不会错过一张脸,并且会消除60% 的错误) ? 如何??
而且,如何构建这些特征来处理图像中不同人脸尺寸的这些统计数据?
我是否遗漏了什么,或者我认为这一切都错了?
如果我不够清楚,我会尝试更好地解释我的困惑。