为了让我的 iOS 应用程序能够识别 1 欧元、2 欧元和 0.50 欧元的硬币,我一直在尝试使用opencv_createsamples
并opencv_traincascade
创建自己的分类器.xml。因此,我从一个短视频中裁剪了 60 张 2 欧元硬币的图像,如下所示:
然后,我使用opencv_createsamples
. 我获得了 12000 张与此类似的图像:
我运行了以下命令:
opencv_createsamples -img positives/i.jpg -bg negatives.txt -info i.txt -num 210 -maxidev 100 -maxxangle 0.0 -maxyangle 0.0 -maxzangle 0.9 -bgcolor 0 -bgthresh 0 -w 48 -h 48
(对于 i 从 0 到 60)
cat *.txt > positives.txt
opencv_createsamples -info positives.txt -bg negatives.txt -vec 2.vec -num 12600 -w 48 -h 48
opencv_traincascade -data final -vec 2.vec -bg negatives.txt -numPos 12000 -numNeg 3000 -numStages 20 -featureType LBP -precalcValBufSize 2048 -precalcIdxBufSize 2048 -minHitRate 0.999 -maxFalseAlarmRate 0.5 -w 48 -h 48
训练在第 13 阶段停止。一旦我得到一个,cascade.xml
我立即(用 )在我的智能手机拍摄的一张简单图像上尝试了它,detectMultiScale()
但没有检测到:
而如果我将其中一张用作培训的图像作为输入,那么它的效果非常好:
我真的不明白为什么会发生这种情况,这让我发疯,最重要的是因为我已经努力让它工作好几个星期了......你能告诉我我在哪里犯了错误吗?
我写的小程序在这里:
#include "opencv2/opencv.hpp"
using namespace cv;
int main(int, char**) {
Mat src = imread("2b.jpg");
Mat src_gray;
std::vector<cv::Rect> money;
CascadeClassifier euro2_cascade;
cvtColor(src, src_gray, CV_BGR2GRAY );
equalizeHist(src_gray, src_gray);
if ( !euro2_cascade.load( "cascade.xml" ) ) {
printf("--(!)Error loading\n");
return -1;
}
euro2_cascade.detectMultiScale( src_gray, money, 1.1, 3, 0|CASCADE_SCALE_IMAGE/*CV_HAAR_FIND_BIGGEST_OBJECT | CV_HAAR_SCALE_IMAGE*/, cv::Size(10, 10),cv::Size(2000, 2000) );
printf("%d\n", int(money.size()));
for( size_t i = 0; i < money.size(); i++ ) {
cv::Point center( money[i].x + money[i].width*0.5, money[i].y + money[i].height*0.5 );
ellipse( src, center, cv::Size( money[i].width*0.5, money[i].height*0.5), 0, 0, 360, Scalar( 255, 0, 255 ), 4, 8, 0 );
}
namedWindow( "Display window", WINDOW_AUTOSIZE );
imwrite("result.jpg",src);
}
我还尝试考虑我的 OpenCV 3.1 版的特征单应性。因此,我为我的版本下载了 opencv_contrib 并尝试编译 xfeatures2d 模块,但在 CMakeList 文件中出现 CMake 错误...而且 xfeature2d 甚至不存在于 xcode 的 opencv 框架中,所以即使我让它在我的电脑上工作,我也可以无论如何不要在iOS中使用它...
更新
正如建议的那样,我刚刚尝试删除equalizeHist(src_gray, src_gray);
并在detectMultiScale()中设置了邻居的数量,这就是我得到的:
更新 2
正如有人建议的那样,按照本教程,我刚刚创建了一个 .vec 文件,仅使用裁剪的正图像,即只有硬币的图像。我使用了这个命令:
opencv_createsamples -vec i.vec -w 48 -h 48 -num 210 -img ./positives/i.jpg -maxidev 100 -maxxangle 0 -maxyangle 0 -maxzangle 0.9 -bgcolor 0 -bgthresh 0
(对于 i 从 0 到 60)
如您所见,没有使用背景图像来创建样本。然后,下载mergevec.py后,我将所有向量文件组合在一起。现在我要开始另一个 LBP 培训......我希望它会更好地工作