3

参考以下链接

Viola & Jones 人脸检测

上面的链接包含有关不同模板对应的 haar 特征数量的计算(以下是链接的摘录)。 在此处输入图像描述

我不知道那些(43200,27600,43200,27600,20736)精确计算是如何进行的。有人可以简单地向我解释一下吗?

4

1 回答 1

4

要理解,请看一下算法#1。对于第一个模式(a),以下两行(文章中的 5 和 6)给出了解释

for all(i,j) such 1<=i<=24 and 1<=j<=24:
  for all(h,w) such that i+h-1<=24 and j+2w-1<=24:

这意味着您将采用左上角的所有组合(i顶部和左侧),然后是适合 24x24j的宽度 ( w) 和高度 ( ) 的所有组合。h

该算法还将使用宽度和高度的所有组合(1x4、1x6、1x8、...、1x24、2x2、2x4、2x6、2x8、...、2x24、3x2、3x4、3x6、...,最多24x24)。只要宽度是 2 的倍数(2w在第 6 行中指定)。

最小的图案(2 像素宽和 1 像素高)将适合 24 * 23 = 552 个位置(23 个水平位置和 24 个垂直位置)。

例如,在某些时候,您将拥有一个 7x10 的图案(高 7 像素,宽 10 像素)。它将适合 18 x 15 = 270 个位置(18 个垂直位置和 15 个水平位置)。

最大的矩形(24x24 像素)由 12 个白色列和 12 个黑色列组成。它只适合一个位置(整个图像)。

如果将所有可能维度的所有位置相加,您将获得数字。

为了得到第一个数字(对于模式 a),下面的程序(我没有优化它!但它应该很容易理解)打印43200

# Pattern A
total = 0
for i in range(1,25):     # 1 <= i <= 24
  for j in range(1,25):     # 1 <= j <= 24
    for w in range(1,13):     # 2*w=2,4,6,...24
      for h in range(1,25):     # h=1,2,...,24
        if (i+h-1<=24) and (j+2*w-1<=24):
          total += 1
print total

其他模式的解释类似。

于 2016-10-23T03:33:21.623 回答