我正在为 Android 构建多人脸跟踪器,我正在使用卡尔曼滤波器,它显然需要一些算法来区分被跟踪的对象,目前我对匈牙利算法感兴趣。
我确实不明白该算法是如何工作的,但如果我有带坐标的二维空间,我无法弄清楚如何构建输入矩阵。因此,假设我在框架中检测到 3 个人:
**Person1** on the coordinates [10, 20]
**Person2** on the coordinates [100, 125]
**Person3** on the coordinates [50, 200]
在下一帧中,在新坐标上仍然检测到 3 个人,但现在我想知道上一张图片中哪个是Person1,哪个是Person2等。
现在我不太确定如何构建矩阵。列应该是这样的不同人:
+---------+-x1--y1--x2--y2--x3--y3-+
| Person1 | |
| Person2 | |
| Person3 | |
+---------+------------------------+
这些值是当前位置和最后找到的位置之间的距离?我知道这可能看起来很愚蠢,但我很困惑。
谢谢您的帮助。