我正在学习 Viola-James 检测框架,我读到它使用 24x24 碱基检测窗口[1][2]。我在理解这个碱基检测窗口时遇到了问题。假设我有一张 1280x960 像素的图像,里面有 3 个人。当我尝试对此图像执行人脸检测时,算法会:
- 将图片缩小到 24x24 像素,
- 用 24x24 像素的大部分平铺图片,然后测试每个部分,
- 将 24x24 窗口定位在图像的左上角,然后在整个图像区域上移动 1px?
任何帮助表示赞赏,甚至是指向另一个解释的链接。
资料来源:https ://www.cs.cmu.edu/~efros/courses/LBMV07/Papers/viola-cvpr-01.pdf
[1] - 第 2 页,积分图像前的最后一段
[2] - 第 4 页,结果