8

为了让我的 iOS 应用程序能够识别 1 欧元、2 欧元和 0.50 欧元的硬币,我一直在尝试使用opencv_createsamplesopencv_traincascade创建自己的分类器.xml。因此,我从一个短视频中裁剪了 60 张 2 欧元硬币的图像,如下所示:

在此处输入图像描述

然后,我使用opencv_createsamples. 我获得了 12000 张与此类似的图像:

在此处输入图像描述

我运行了以下命令:

opencv_createsamples -img positives/i.jpg -bg negatives.txt -info i.txt -num 210 -maxidev 100 -maxxangle 0.0 -maxyangle 0.0 -maxzangle 0.9 -bgcolor 0 -bgthresh 0 -w 48 -h 48(对于 i 从 0 到 60)

cat *.txt > positives.txt

opencv_createsamples -info positives.txt -bg negatives.txt -vec 2.vec -num 12600 -w 48 -h 48

opencv_traincascade -data final -vec 2.vec -bg negatives.txt -numPos 12000 -numNeg 3000 -numStages 20 -featureType LBP -precalcValBufSize 2048 -precalcIdxBufSize 2048 -minHitRate 0.999 -maxFalseAlarmRate 0.5 -w 48 -h 48

训练在第 13 阶段停止。一旦我得到一个,cascade.xml我立即(用 )在我的智能手机拍摄的一张简单图像上尝试了它,detectMultiScale()但没有检测到:

在此处输入图像描述

而如果我将其中一张用作培训的图像作为输入,那么它的效果非常好:

在此处输入图像描述

我真的不明白为什么会发生这种情况,这让我发疯,最重要的是因为我已经努力让它工作好几个星期了......你能告诉我我在哪里犯了错误吗?

我写的小程序在这里:

#include "opencv2/opencv.hpp"

using namespace cv;

int main(int, char**) {

Mat src = imread("2b.jpg");

Mat src_gray;

std::vector<cv::Rect> money;

CascadeClassifier euro2_cascade;

cvtColor(src, src_gray, CV_BGR2GRAY );
equalizeHist(src_gray, src_gray);

if ( !euro2_cascade.load( "cascade.xml" ) ) {
    printf("--(!)Error loading\n");
    return -1;
}

euro2_cascade.detectMultiScale( src_gray, money, 1.1, 3, 0|CASCADE_SCALE_IMAGE/*CV_HAAR_FIND_BIGGEST_OBJECT | CV_HAAR_SCALE_IMAGE*/, cv::Size(10, 10),cv::Size(2000, 2000) );
printf("%d\n", int(money.size()));

for( size_t i = 0; i < money.size(); i++ ) {
    cv::Point center( money[i].x + money[i].width*0.5, money[i].y + money[i].height*0.5 );
    ellipse( src, center, cv::Size( money[i].width*0.5, money[i].height*0.5), 0, 0, 360, Scalar( 255, 0, 255 ), 4, 8, 0 );
}

namedWindow( "Display window", WINDOW_AUTOSIZE );
imwrite("result.jpg",src);
}

我还尝试考虑我的 OpenCV 3.1 版的特征单应性。因此,我为我的版本下载了 opencv_contrib 并尝试编译 xfeatures2d 模块,但在 CMakeList 文件中出现 CMake 错误...而且 xfeature2d 甚至不存在于 xcode 的 opencv 框架中,所以即使我让它在我的电脑上工作,我也可以无论如何不要在iOS中使用它...

更新

正如建议的那样,我刚刚尝试删除equalizeHist(src_gray, src_gray);并在detectMultiScale()中设置了邻居的数量,这就是我得到的:

在此处输入图像描述

更新 2

正如有人建议的那样,按照教程,我刚刚创建了一个 .vec 文件,仅使用裁剪的正图像,即只有硬币的图像。我使用了这个命令:

opencv_createsamples -vec i.vec -w 48 -h 48 -num 210 -img ./positives/i.jpg -maxidev 100 -maxxangle 0 -maxyangle 0 -maxzangle 0.9 -bgcolor 0 -bgthresh 0 (对于 i 从 0 到 60)

如您所见,没有使用背景图像来创建样本。然后,下载mergevec.py后,我将所有向量文件组合在一起。现在我要开始另一个 LBP 培训......我希望它会更好地工作

4

2 回答 2

1

这可能是由于缺乏代表可能案例的总体情况的训练数据的原因。您并未向模型提供全部信息。如果没有更多数据,

  1. 您应该旋转图像,以随机大小和角度裁剪它们,翻转(沿垂直边缘镜像)基本上数据增强
  2. 您可以进行背景分离,然后使用模型进行分类
  3. 将图像转换为grey scale然后操作分类模型(有时颜色可能会误导模型)
于 2018-04-05T11:34:47.137 回答
1

您的级联没有正确训练。您不仅应该为您的硬币添加不同的背景,还应该在 3 个角度添加不同的比例和不同的旋转。还要为训练添加更多的负数(你有很多小的检测,这意味着级联没有在负数上训练)

于 2018-04-05T09:08:52.037 回答