对 OpenCV 来说非常新,我尝试训练一个可以从侧面检测狗图像的 haar 分类器。我已将本教程用作指南。作者建议可以使用数量惊人的样本图像来训练一个相对有效的分类器。按照他的指示,我收集了 40 个阳性和 600 个阴性,然后使用提供的脚本以 .vec 文件的形式生成更多样本。通过 20 个阶段的训练大约需要一周半的时间,参数如下:
<?xml version="1.0"?>
<opencv_storage>
<params>
<stageType>BOOST</stageType>
<featureType>HAAR</featureType>
<height>64</height>
<width>80</width>
<stageParams>
<boostType>GAB</boostType>
<minHitRate>9.9900001287460327e-01</minHitRate>
<maxFalseAlarm>5.0000000000000000e-01</maxFalseAlarm>
<weightTrimRate>9.4999999999999996e-01</weightTrimRate>
<maxDepth>1</maxDepth>
<maxWeakCount>100</maxWeakCount></stageParams>
<featureParams>
<maxCatCount>0</maxCatCount>
<featSize>1</featSize>
<mode>ALL</mode></featureParams></params>
</opencv_storage>
在最后一个阶段,Neg Count Acceptance Ratio 下降到 0.000579——我认为这意味着 0.0579% 的负样本被错误地归类为正样本,即在它们没有的情况下有狗。换言之,99.942% 的样本被正确识别。这些对我来说似乎是相当不错的数字,但是当我将分类器 .xml 文件插入面部检测程序时,结果很糟糕。
这是用于分析全黑图像的分类器图片(设备的摄像头平放在工作台上,以防止任何光线进入):
(想象一个黑色的屏幕,有几个随机放置的绿色矩形边框,有些重叠。可悲的是,我似乎没有必要的声誉来发布真实的东西......)
我对修复分类器的最佳猜测是,我需要使用更大的负样本和正样本池进行重新训练。
我真正想知道的是:为什么分类器的接受率和真实世界的性能如此不同?我是否误解了接受率的含义?如果我对比率的理解是正确的,我应该期望什么样的数字会给我一个有效的分类器?
任何帮助将不胜感激。