我需要跟踪在建筑物内走动的人。我在距地面 6 米(20 英尺)的天花板上安装了一个向下的网络摄像头。
性能很重要,因为计划是让它在多个网络摄像头上实时运行。目前我安装了一个摄像头,并且在 GPU 上使用 VIBE 进行背景减法,我在 720p 上获得约 320 fps,这很棒。
虽然 VIBE 表现良好,但我正在努力保持一致性。如果人们走得太近,他们就会被认为是一团。我还需要忽略非人类物体的运动。
我真的需要你们的一些意见和想法,如何确定什么是人类,什么不是我的 VIBE 输出。什么是明智的做法?我试图将人类定义为具有一定的正方形像素大小,但我觉得必须有更聪明的方法来区分人类与非人类运动。
如果另一种方法有意义,例如光流、跟踪学习检测算法(OpenTLD?)、性能良好的 HOG,我会非常有兴趣了解它。
任何想法和意见表示赞赏:)