viola-jones - Viola-Jones - 24x24 窗口是什么意思？

Question

我正在学习 Viola-James 检测框架，我读到它使用 24x24 碱基检测窗口[1][2]。我在理解这个碱基检测窗口时遇到了问题。假设我有一张 1280x960 像素的图像，里面有 3 个人。当我尝试对此图像执行人脸检测时，算法会：

任何帮助表示赞赏，甚至是指向另一个解释的链接。

[1] - 第 2 页，积分图像前的最后一段

[2] - 第 4 页，结果

score 1 · Accepted Answer

我发现这个视频完美地解释了检测窗口如何在图片上移动和缩放。我想画一个流程图，但我认为视频能更好地说明它：

感谢视频的原作者。

score 1 · Accepted Answer

这个视频有帮助吗？时长 40 分钟。

该算法也称为 Haar Cascades，在人脸检测中非常流行。

该页面的大约一半是另一个视频，它显示了正在进行的超级慢动作扫描，因此您可以看到窗口如何开始变小（尽管出于演示目的远大于 24x24）并逐像素移动图像，然后在连续较大的正方形部分上一次又一次地进行。在每个阶段，它仍然只查看那些窗口，就好像它们被重新采样为 24x24 大小一样。

您还可以看到它如何快速拒绝其中许多窗口，并将大部分时间花在看起来像人脸的区域，同时计算越来越复杂的比较变得更加严格。这就是“级联”一词发挥作用的地方。

2 回答 2