c++ - 为什么 OpenCV 只在训练图像中识别对象？

Question

为了让我的 iOS 应用程序能够识别 1 欧元、2 欧元和 0.50 欧元的硬币，我一直在尝试使用opencv_createsamples并opencv_traincascade创建自己的分类器.xml。因此，我从一个短视频中裁剪了 60 张 2 欧元硬币的图像，如下所示：

然后，我使用opencv_createsamples. 我获得了 12000 张与此类似的图像：

我运行了以下命令：

opencv_createsamples -img positives/i.jpg -bg negatives.txt -info i.txt -num 210 -maxidev 100 -maxxangle 0.0 -maxyangle 0.0 -maxzangle 0.9 -bgcolor 0 -bgthresh 0 -w 48 -h 48（对于 i 从 0 到 60）

cat *.txt > positives.txt

opencv_createsamples -info positives.txt -bg negatives.txt -vec 2.vec -num 12600 -w 48 -h 48

opencv_traincascade -data final -vec 2.vec -bg negatives.txt -numPos 12000 -numNeg 3000 -numStages 20 -featureType LBP -precalcValBufSize 2048 -precalcIdxBufSize 2048 -minHitRate 0.999 -maxFalseAlarmRate 0.5 -w 48 -h 48

训练在第 13 阶段停止。一旦我得到一个，cascade.xml我立即（用）在我的智能手机拍摄的一张简单图像上尝试了它，detectMultiScale()但没有检测到：

而如果我将其中一张用作培训的图像作为输入，那么它的效果非常好：

我真的不明白为什么会发生这种情况，这让我发疯，最重要的是因为我已经努力让它工作好几个星期了......你能告诉我我在哪里犯了错误吗？

我写的小程序在这里：

#include "opencv2/opencv.hpp"

using namespace cv;

int main(int, char**) {

Mat src = imread("2b.jpg");

Mat src_gray;

std::vector<cv::Rect> money;

CascadeClassifier euro2_cascade;

cvtColor(src, src_gray, CV_BGR2GRAY );
equalizeHist(src_gray, src_gray);

if ( !euro2_cascade.load( "cascade.xml" ) ) {
    printf("--(!)Error loading\n");
    return -1;
}

euro2_cascade.detectMultiScale( src_gray, money, 1.1, 3, 0|CASCADE_SCALE_IMAGE/*CV_HAAR_FIND_BIGGEST_OBJECT | CV_HAAR_SCALE_IMAGE*/, cv::Size(10, 10),cv::Size(2000, 2000) );
printf("%d\n", int(money.size()));

for( size_t i = 0; i < money.size(); i++ ) {
    cv::Point center( money[i].x + money[i].width*0.5, money[i].y + money[i].height*0.5 );
    ellipse( src, center, cv::Size( money[i].width*0.5, money[i].height*0.5), 0, 0, 360, Scalar( 255, 0, 255 ), 4, 8, 0 );
}

namedWindow( "Display window", WINDOW_AUTOSIZE );
imwrite("result.jpg",src);
}

我还尝试考虑我的 OpenCV 3.1 版的特征单应性。因此，我为我的版本下载了 opencv_contrib 并尝试编译 xfeatures2d 模块，但在 CMakeList 文件中出现 CMake 错误...而且 xfeature2d 甚至不存在于 xcode 的 opencv 框架中，所以即使我让它在我的电脑上工作，我也可以无论如何不要在iOS中使用它...

更新

正如建议的那样，我刚刚尝试删除equalizeHist(src_gray, src_gray);并在detectMultiScale（）中设置了邻居的数量，这就是我得到的：

更新 2

正如有人建议的那样，按照本教程，我刚刚创建了一个 .vec 文件，仅使用裁剪的正图像，即只有硬币的图像。我使用了这个命令：

opencv_createsamples -vec i.vec -w 48 -h 48 -num 210 -img ./positives/i.jpg -maxidev 100 -maxxangle 0 -maxyangle 0 -maxzangle 0.9 -bgcolor 0 -bgthresh 0 （对于 i 从 0 到 60）

如您所见，没有使用背景图像来创建样本。然后，下载mergevec.py后，我将所有向量文件组合在一起。现在我要开始另一个 LBP 培训......我希望它会更好地工作

score 1 · Accepted Answer

这可能是由于缺乏代表可能案例的总体情况的训练数据的原因。您并未向模型提供全部信息。如果没有更多数据，

您应该旋转图像，以随机大小和角度裁剪它们，翻转（沿垂直边缘镜像）基本上数据增强
您可以进行背景分离，然后使用模型进行分类
将图像转换为grey scale然后操作分类模型（有时颜色可能会误导模型）

score 1 · Accepted Answer

您的级联没有正确训练。您不仅应该为您的硬币添加不同的背景，还应该在 3 个角度添加不同的比例和不同的旋转。还要为训练添加更多的负数（你有很多小的检测，这意味着级联没有在负数上训练）

c++ - 为什么 OpenCV 只在训练图像中识别对象？

2 回答 2

Related

Reference