algorithm - Viola Jones 阈值 Haar 特征误差值

Question

我已经阅读了 2004 年的中提琴论文。在 3.1 中，他们解释了阈值计算。但我超级困惑。它读作

对于每个特征，示例根据特征值进行排序

问题1）排序列表是从示例的积分图像计算的haar特征值列表。因此，如果我们有一个特征和 10 张图像（正面和负面）。我们得到与每个输入图像相关的 10 个结果。

然后可以在这个排序列表上单次计算该特征的 AdaBoost 最佳阈值。对于排序列表中的每个元素，维护和评估四个总和：正样本权重总和 T +、负样本权重总和 T -、当前样本 S+ 以下的正样本权重总和以及负样本权重总和权重低于当前示例 S-</p>

问题2）排序的目的是什么。我猜最高的那个是最能描述图像的那个。但在算法上它如何影响（S- S+ T+ T-）。

问题3）现在我们计算一个排序列表（S- S+ T+ T-）。这是否意味着每个条目都有自己的 (S- S+ T- T+) 或者整个列表只有一个 (S- S+ T- T+)。

在排序列表中分割当前示例和前一个示例之间的范围的阈值的错误是： e = min ( S+ + (T - - S-), S- + (T + - S+)) ，

问题4）这在一定程度上回答了我之前的问题，但我不确定。所以为了我们每个输入图像都有“e”。我们需要为列表中的每个条目维护 (S- S+ T- T+)。但是，在我们为该特征计算 N 个（每个图像一个）之后，我们如何处理“e”。

在此先感谢，如果这令人困惑，或者您需要对我的问题进行更多说明，请告诉我。

score 3 · Accepted Answer

问题1）排序列表是从示例的积分图像计算的haar特征值列表。因此，如果我们有一个特征和 10 张图像（正面和负面）。我们得到与每个输入图像相关的 10 个结果。

您会得到 10 个该特征的结果，每个输入图像关联一个结果。每个图像都被标记为正面或负面。

问题2）排序的目的是什么。我猜最高的那个是最能描述图像的那个。但在算法上它如何影响（S- S+ T+ T-）。

最高的图像是对该特征具有最高响应的图像。您根据响应进行排序，而不是根据权重。

您对它们进行排序的原因是您尝试计算的两件事是“当前示例 S+ 以下的正权重总和和当前示例 S- 以下的负权重总和”。如果列表已排序，那么您可以保持一个运行总和，并且在每个点上，在此之前您已将其权重添加到总和的所有示例的特征响应都将小于（即“低于”）当前示例。如果列表未排序，那将不起作用。然后，您可以评估与使用该示例和下一个示例之间的中间响应级别作为阈值相关的错误。

问题3）现在我们计算一个排序列表（S- S+ T+ T-）。这是否意味着每个条目都有自己的 (S- S+ T- T+) 或者整个列表只有一个 (S- S+ T- T+)。

每个示例将有一个 S- 和一个 S+，因为它是“低于当前示例的正权重的总和”。T+ 和 T- 是针对整个列表计算的，我不知道他们为什么说您需要为每个元素维护它。

问题4）这在一定程度上回答了我之前的问题，但我不确定。所以为了我们每个输入图像都有“e”。我们需要为列表中的每个条目维护 (S- S+ T- T+)。但是，在我们为该特征计算 N 个（每个图像一个）之后，我们如何处理“e”。

您从所有这些中选择了最小值，这是放置阈值的最佳位置（这将是这两个示例的响应的中点），因为它具有最小的错误（误报 + 误报）。顺便说一句，每个点有两个选择（即 e = min ( S+ + (T − − S−), S− + (T + − S+)) ）的原因是您可以选择是否设置阈值，以便高于该响应水平的值被认为是积极的（第一项），或低于它的值被认为是积极的。

如果是前者，那么 S+ 是您的误报， (T- - S-) 是您的误报。如果是后者，那么 S- 是您的误报， (T+ - S+) 是您的误报。

algorithm - Viola Jones 阈值 Haar 特征误差值

1 回答 1

Related

Reference