2

我正在研究 Viola-Jones 的论文,以便更好地理解他们的目标检测算法并制作一个适用的程序。在特征主题的最后一段中,作者谈到了检测器的基本分辨率是 24x24,他们说矩形特征的详尽集合相当大,超过 180,000 个。请注意,与 Haar 基不同,矩形特征集是过完备的。这是否意味着每个矩形特征都是 24 x 24 还是仅仅意味着我们将给定图像划分为 24*24 块?180000 是每 24*24 块找到几种类 Haar 特征的结果?而且我也无法理解最后一部分指出矩形特征集过于完整。当我们谈论矩形特征时,过度完备意味着什么?谢谢。

4

1 回答 1

1

每个 24X24 矩形特征只为您提供一个数字,如前面在同一段落中所述“两个矩形特征的值是两个矩形区域内像素总和之间的差”和“一个三矩形特征计算其中的总和” “从中心矩形的总和中减去两个外部矩形。最后,一个四矩形特征计算对角矩形对之间的差异。”

关于数字 180,00 的解释可以在以下位置找到: Viola-Jones 的人脸检测声称有 180k 特征

过完备集意味着您有一些特征是其他特征的线性组合。在 24X24 矩形特征的情况下,我们可以通过在其中一个正方形中取值为 1 并且在所有其余部分中取值为 0 的所有矩形来为该空间构建一个线性基础。如果我们计算这个配置有多少选项,我们会得到 24*24=576,它远小于 180,000。这意味着从他们的 180,000 个集合中,我们可以得到一些矩形,作为我们集合中其他矩形的组合。

于 2016-08-05T06:17:55.743 回答