8

问题描述: 我正在从事一个项目,其目标是识别图像中的人的身体部位(躯干、头部、左右臂等)。该方法基于找到人体的各个部分(假设),然后搜索最佳姿势配置(= 真正构成人体的所有部分)。此链接http://www.di.ens.fr/willow/events/cvml2010/materials/INRIA_summer_school_2010_Andrew_human_pose.pdf更好地描述了这个想法。

该假设是在分别对每个身体部位运行检测算法(这里我使用来自机器学习领域的分类器)之后获得的。因此,每个假设的类型都是已知的。此外,每个假设都有一个位置(图像中的 x 和 y 坐标)和方向。

为了确定将两个部分连接在一起的成本,可以考虑将头部类型的每个假设与躯干类型的每个假设联系起来(例如)。但是,位于图像右上角的头部假设不能(从人类的角度)与位于图像左下角的躯干假设联系起来。我试图根据最后一条语句以及由于执行时间来避免这些类型的链接。

问题:我计划通过考虑到可能是链接候选的最远假设的距离来减少搜索空间。解决这个搜索问题的最快方法是什么?

4

2 回答 2

2

对于类似的问题,我将源图像分成 16 个(或更多,取决于您尝试链接的部分的相对大小)较小的图像,分别在每个图像中执行检测和链接步骤,以及额外的步骤,您将只为每个子图像执行一个链接步骤,并且它是(可能是 8 个)邻居。

在这种情况下,您甚至永远不会尝试将左上角的一个部分与右下角的一个部分联系起来,而且作为额外的奖励,您的问题的第一部分现在非常平行。

更新:您可以先对图像进行边缘检测,并且永远不要将图像切成两半,因为这意味着将边缘切成两半。递归地这样做可以让你得到很多带有身体部位的小图像,然后你可以单独处理。

于 2013-04-15T13:40:05.307 回答
1

这种离散分配问题可以使用匈牙利算法来解决。

在成本(=距离)矩阵的计算中,当距离大于预定义的阈值时,您可以将条目设置为某个无限或非常高的值,这将防止算法将头部分配给太远的躯干离开。

最后一种技术在跟踪讲座中也称为门控。

于 2013-04-15T14:13:56.970 回答