首先,我尝试了 OpenCV 库中的默认人员检测器。
HOGDescriptor hog;
hog.setSVMDetector(HOGDescriptor::getDefaultPeopleDetector());
hog.detectMultiScale(img, found, 0, Size(8,8), Size(0,0), 1.05, 2);
尽管它在带有网络摄像头的室内环境中返回正匹配,但它们非常罕见。所以我用 INRIA 数据集的负片和正片图像训练了描述符,但这次误报太多了。我并不是想将错误匹配降低到零,将它们降低到合理的水平就足够了。我应该怎么办?
另一个问题是,我认为我的示例视频中的人物距离太远,无法轻松区分为人类图像。我尝试减小单元大小,但不确定这是正确的方法。关于这个还能做什么?
图片会对您有所帮助,但由于声誉问题,我无法发布它们。
谢谢