我已经阅读了 2004 年的中提琴论文。在 3.1 中,他们解释了阈值计算。但我超级困惑。它读作
对于每个特征,示例根据特征值进行排序
问题1)排序列表是从示例的积分图像计算的haar特征值列表。因此,如果我们有一个特征和 10 张图像(正面和负面)。我们得到与每个输入图像相关的 10 个结果。
然后可以在这个排序列表上单次计算该特征的 AdaBoost 最佳阈值。对于排序列表中的每个元素,维护和评估四个总和:正样本权重总和 T +、负样本权重总和 T -、当前样本 S+ 以下的正样本权重总和以及负样本权重总和权重低于当前示例 S-</p>
问题2)排序的目的是什么。我猜最高的那个是最能描述图像的那个。但在算法上它如何影响(S- S+ T+ T-)。
问题3)现在我们计算一个排序列表(S- S+ T+ T-)。这是否意味着每个条目都有自己的 (S- S+ T- T+) 或者整个列表只有一个 (S- S+ T- T+)。
在排序列表中分割当前示例和前一个示例之间的范围的阈值的错误是: e = min ( S+ + (T - - S-), S- + (T + - S+)) ,
问题4)这在一定程度上回答了我之前的问题,但我不确定。所以为了我们每个输入图像都有“e”。我们需要为列表中的每个条目维护 (S- S+ T- T+)。但是,在我们为该特征计算 N 个(每个图像一个)之后,我们如何处理“e”。
在此先感谢,如果这令人困惑,或者您需要对我的问题进行更多说明,请告诉我。