我正在研究一种算法来估计视频中检测到的人的高度,但我被卡住了。
我工作的部分是使用 HoG 算法检测人,所以我为框架中的每个人都有一个边界框。而且我已经校准了相机,所以我有我的内在和外在相机参数。
问题是现在我有一个带有 2 个未知数的透视投影公式:物体的高度和物体到相机的距离。我正在使用一个单声道网络摄像头来检测人,所以我没有关于物体到摄像头距离的信息。高度是我要估计的,所以我也没有。
我知道如果我使用 kinect 或立体摄像头来获取距离,这个问题是可以解决的,但我仅限于一个单声道网络摄像头。
有谁知道如何解决这个问题?我已阅读有关使用引用对象的信息,但我不知道如何使用它们来解决我的问题。