machine-learning - 用于检测物体的类似 Haar 的特征

Question

我正在研究 Viola-Jones 的论文，以便更好地理解他们的目标检测算法并制作一个适用的程序。在特征主题的最后一段中，作者谈到了检测器的基本分辨率是 24x24，他们说矩形特征的详尽集合相当大，超过 180,000 个。请注意，与 Haar 基不同，矩形特征集是过完备的。这是否意味着每个矩形特征都是 24 x 24 还是仅仅意味着我们将给定图像划分为 24*24 块？180000 是每 24*24 块找到几种类 Haar 特征的结果？而且我也无法理解最后一部分指出矩形特征集过于完整。当我们谈论矩形特征时，过度完备意味着什么？谢谢。

score 1 · Accepted Answer

每个 24X24 矩形特征只为您提供一个数字，如前面在同一段落中所述“两个矩形特征的值是两个矩形区域内像素总和之间的差”和“一个三矩形特征计算其中的总和” “从中心矩形的总和中减去两个外部矩形。最后，一个四矩形特征计算对角矩形对之间的差异。”

关于数字 180,00 的解释可以在以下位置找到： Viola-Jones 的人脸检测声称有 180k 特征

过完备集意味着您有一些特征是其他特征的线性组合。在 24X24 矩形特征的情况下，我们可以通过在其中一个正方形中取值为 1 并且在所有其余部分中取值为 0 的所有矩形来为该空间构建一个线性基础。如果我们计算这个配置有多少选项，我们会得到 24*24=576，它远小于 180,000。这意味着从他们的 180,000 个集合中，我们可以得到一些矩形，作为我们集合中其他矩形的组合。

machine-learning - 用于检测物体的类似 Haar 的特征

1 回答 1

Related

Reference