2

我一直在尝试编写一个识别铅笔帽的应用程序(在这种情况下)。

我已经拍摄了大约 40 张物体的照片,以及 635 张没有物体的照片。然后我一直在使用 perl 脚本“createsamples.pl”通过这个命令从 40 张正面图片中生成 3000 张正面图片(我也尝试生成 1500 张图片,结果相同):

createsamples.pl p.dat n.dat output

p.dat是40张正片名称的文件,n.dat是636张负片名称的文件。

我一直在将创建的矢量文件合并到一个矢量文件中,然后我一直在尝试像这样开始训练:

opencv_traincascade -data cascades -vec samples.vec -bg n.dat -numPos 1000 -numNeg 635 -numStages 1 -w 20 -h 20 -featureType LBP

这在几秒钟内完成,但是当我在我的应用程序中尝试它时给了我无数错误检测。

所以我再次尝试了更多阶段,最多 20 个。

===== TRAINING 19-stage =====
BEGIN
POS count : consumed   2000 : 2302
NEG count : acceptanceRatio    635 : 0.000145818
Precalculation time: 1.487
+----+---------+---------+
|  N |    HR   |    FA   |
+----+---------+---------+
|   1|        1|        1|
+----+---------+---------+
|   2|    0.997| 0.829921|
+----+---------+---------+
|   3|    0.997| 0.829921|
+----+---------+---------+
|   4|   0.9985| 0.856693|
+----+---------+---------+
|   5|   0.9965| 0.694488|
+----+---------+---------+
|   6|   0.9955| 0.645669|
+----+---------+---------+
|   7|   0.9955|      0.6|
+----+---------+---------+
|   8|    0.996| 0.579528|
+----+---------+---------+
|   9|   0.9955| 0.544882|
+----+---------+---------+
|  10|   0.9955| 0.540157|
+----+---------+---------+
|  11|   0.9955| 0.359055|
+----+---------+---------+
END>

在这个阶段,我仍然得到错误检测,不再那么多了,但它们仍然存在。

所以我尝试了更多的阶段,最多 30 个。但是在第 21 阶段的训练中,我已经得到了这个接受率:

===== TRAINING 20-stage =====
BEGIN
POS count : consumed   2000 : 2320
NEG count : acceptanceRatio    635 : 9.72903e-005
Precalculation time: 1.493
+----+---------+---------+
|  N |    HR   |    FA   |
+----+---------+---------+
|   1|        1|        1|
+----+---------+---------+
|   2|    0.997| 0.831496|
+----+---------+---------+
|   3|    0.997| 0.831496|
+----+---------+---------+
|   4|    0.999| 0.779528|
+----+---------+---------+
|   5|   0.9955|  0.64252|
+----+---------+---------+
|   6|   0.9965| 0.694488|
+----+---------+---------+
|   7|   0.9955| 0.689764|
+----+---------+---------+
|   8|   0.9955| 0.628346|
+----+---------+---------+
|   9|    0.996| 0.645669|
+----+---------+---------+
|  10|   0.9965| 0.541732|
+----+---------+---------+
|  11|   0.9955|  0.43622|
+----+---------+---------+
END>

这个接受率意味着分类器被过度训练了,对吧?至少这就是人们在stackoverflow上提到的几个问题。

我使用视频捕捉并将物体(铅笔帽)放在相机前面以检测它。在大多数帧中,它仍然会被检测到,但与帽子位于同一背景上的任何其他物体也会被检测到。

40张正面图片是这样的:

http://i.imgur.com/fOqiyP8.jpg

其中 10 幅是在灰色背景下拍摄的,10 幅是在红色背景上拍摄的,10 幅是在银色背景上拍摄的,10 幅是在我的键盘上盖着帽子时拍摄的。

总而言之,我的问题:

1)我正在使用的 40 张图片可以使用吗?还是应该根本没有背景?因为现在,当我将我的视频捕捉指向我之前使用的红色背景时,我会得到错误检测。发生情况的示例(请删除空格):http://i.imgur.com/w0szcTh.jpg?1

2)我是否完全走错了实现目标的道路?

3)我发现的关于我正在尝试的最好的教程是这个: http ://coding-robin.de/2013/07/22/train-your-own-opencv-haar-classifier.html 他的图片也显示了背景,但似乎他没有得到错误的检测。你知道我的方法还有什么问题吗?

在此先感谢大家,我希望你们中的任何人都可以在这里帮助我。

4

1 回答 1

0

我认为,对于这个问题,颜色检测+轮廓查找应该是更有效的方法。另请查看http://code.google.com/p/cvblob/

Haar cascades 适用于灰度图像,并且您的对象没有太多视觉特征可以将其与其他对象区分开来,这就是为什么您的检测器有很多错误检测器的原因。

于 2013-08-21T14:12:57.343 回答