8

在他们描述Viola-Jones 对象检测框架(Viola 和 Jones 的 Robust Real-Time Face Detection)的论文中,据说:

用于训练的所有示例子窗口都进行了方差归一化,以最大限度地减少不同照明条件的影响。

我的问题是“他们使用什么样的工具来标准化图像?”

我不是在寻找 Viola & Jones 使用的特定工具,而是在寻找产生几乎相同输出的类似工具。我一直在关注很多 haar 培训教程(试图检测手),但还不能输出一个好的检测器(xml)。

我已经尝试联系作者,但仍然没有回复。

4

1 回答 1

5

一种可能的方法是应用简单而简单的归一化,假设所有元素均呈正态分布。

首先求平均值 (Mu) 和标准差(S):

Mu = 1/N * Sum(a[i][j]) for each i,j 
S  =  sqrt(1/(N-1) *  Sum((a[i][j] - Mu)^2)) for each i,j
       (in here N is the number of pixels, 20*20 in the viola jones case)

由此,我们可以使用标准正态分布公式对每个像素的值进行归一化(通过对所有值进行标准化):

a'[i][j] = (a[i][j] - Mu) / S

另一种方法是向量归一化,它基本上说:

  • 求向量的长度|a| = sqrt(sum (a[i][j]*a[i][j])) for each i,j
  • 分配:a'[i][j] = a[i][j] / |a|
于 2012-12-12T08:41:57.367 回答