我一直在尝试编写一个识别铅笔帽的应用程序(在这种情况下)。
我已经拍摄了大约 40 张物体的照片,以及 635 张没有物体的照片。然后我一直在使用 perl 脚本“createsamples.pl”通过这个命令从 40 张正面图片中生成 3000 张正面图片(我也尝试生成 1500 张图片,结果相同):
createsamples.pl p.dat n.dat output
p.dat是40张正片名称的文件,n.dat是636张负片名称的文件。
我一直在将创建的矢量文件合并到一个矢量文件中,然后我一直在尝试像这样开始训练:
opencv_traincascade -data cascades -vec samples.vec -bg n.dat -numPos 1000 -numNeg 635 -numStages 1 -w 20 -h 20 -featureType LBP
这在几秒钟内完成,但是当我在我的应用程序中尝试它时给了我无数错误检测。
所以我再次尝试了更多阶段,最多 20 个。
===== TRAINING 19-stage =====
BEGIN
POS count : consumed 2000 : 2302
NEG count : acceptanceRatio 635 : 0.000145818
Precalculation time: 1.487
+----+---------+---------+
| N | HR | FA |
+----+---------+---------+
| 1| 1| 1|
+----+---------+---------+
| 2| 0.997| 0.829921|
+----+---------+---------+
| 3| 0.997| 0.829921|
+----+---------+---------+
| 4| 0.9985| 0.856693|
+----+---------+---------+
| 5| 0.9965| 0.694488|
+----+---------+---------+
| 6| 0.9955| 0.645669|
+----+---------+---------+
| 7| 0.9955| 0.6|
+----+---------+---------+
| 8| 0.996| 0.579528|
+----+---------+---------+
| 9| 0.9955| 0.544882|
+----+---------+---------+
| 10| 0.9955| 0.540157|
+----+---------+---------+
| 11| 0.9955| 0.359055|
+----+---------+---------+
END>
在这个阶段,我仍然得到错误检测,不再那么多了,但它们仍然存在。
所以我尝试了更多的阶段,最多 30 个。但是在第 21 阶段的训练中,我已经得到了这个接受率:
===== TRAINING 20-stage =====
BEGIN
POS count : consumed 2000 : 2320
NEG count : acceptanceRatio 635 : 9.72903e-005
Precalculation time: 1.493
+----+---------+---------+
| N | HR | FA |
+----+---------+---------+
| 1| 1| 1|
+----+---------+---------+
| 2| 0.997| 0.831496|
+----+---------+---------+
| 3| 0.997| 0.831496|
+----+---------+---------+
| 4| 0.999| 0.779528|
+----+---------+---------+
| 5| 0.9955| 0.64252|
+----+---------+---------+
| 6| 0.9965| 0.694488|
+----+---------+---------+
| 7| 0.9955| 0.689764|
+----+---------+---------+
| 8| 0.9955| 0.628346|
+----+---------+---------+
| 9| 0.996| 0.645669|
+----+---------+---------+
| 10| 0.9965| 0.541732|
+----+---------+---------+
| 11| 0.9955| 0.43622|
+----+---------+---------+
END>
这个接受率意味着分类器被过度训练了,对吧?至少这就是人们在stackoverflow上提到的几个问题。
我使用视频捕捉并将物体(铅笔帽)放在相机前面以检测它。在大多数帧中,它仍然会被检测到,但与帽子位于同一背景上的任何其他物体也会被检测到。
40张正面图片是这样的:
http://i.imgur.com/fOqiyP8.jpg
其中 10 幅是在灰色背景下拍摄的,10 幅是在红色背景上拍摄的,10 幅是在银色背景上拍摄的,10 幅是在我的键盘上盖着帽子时拍摄的。
总而言之,我的问题:
1)我正在使用的 40 张图片可以使用吗?还是应该根本没有背景?因为现在,当我将我的视频捕捉指向我之前使用的红色背景时,我会得到错误检测。发生情况的示例(请删除空格):http://i.imgur.com/w0szcTh.jpg?1
2)我是否完全走错了实现目标的道路?
3)我发现的关于我正在尝试的最好的教程是这个: http ://coding-robin.de/2013/07/22/train-your-own-opencv-haar-classifier.html 他的图片也显示了背景,但似乎他没有得到错误的检测。你知道我的方法还有什么问题吗?
在此先感谢大家,我希望你们中的任何人都可以在这里帮助我。