在这个有启发性的 kaggle 比赛的介绍的最后,他们指出“ Viola 和 Jones 的开创性论文中使用的方法非常有效”。然而,那篇论文描述了一个二元面部识别系统,解决的问题是关键点的分类,而不是整个图像。我很难弄清楚我将如何调整 Viola/Jones 系统以进行关键点识别。
我假设我应该为每个关键点训练一个单独的分类器,我的一些想法是:
迭代固定大小的子图像并对每个子图像进行分类,其中以关键点为中心像素的图像是一个正例。在这种情况下,我不确定如何处理靠近图像边缘的像素。
不是训练二元分类器,而是训练具有 l*w 个可能类的分类器(每个像素一个)。最大的问题是我怀疑它会非常慢,因为每个弱分类器突然必须做 l*w*original 操作
我的第三个想法并没有完全在我的脑海中浮出水面,但是由于关键点是脸部大部分的每个部分(例如眼睛的左、右中心),也许我可以尝试对子进行分类图像只是一只眼睛,然后使用每个面部部分的最佳拟合子图像的左、右和中心像素(以 y 坐标为中心)
这些想法有什么优点吗,有没有我没有想到的方法?