这是关于Viola-Jones 算法(用于人脸检测)的问题,如此处所述
http://en.wikipedia.org/wiki/Viola%E2%80%93Jones_object_detection_framework
在原始论文中
http://citeseerx.ist.psu.edu/viewdoc/summary?doi=10.1.1.110.4868
我的问题是:
- 他们描述了 3 种特征。并给出 4 个功能示例。每个 24x24 窗口计算的功能这么多?3 还是 4?或者他们是否使用了这 4 个功能的所有可能大小?(会很多)
- 显然,其中一项功能可以出现在该 24x24 窗口的不同位置。那么有多少次,在什么确切位置?
- 它们描述了 3 种分类器,但显然它们可以进行很多修改(比如 A 旋转为 B)。翻转或反转分类器 D 也是有意义的。他们是只使用这 4 种类型,还是以多种方式修改所有这些类型?