是否可以分析图像并确定其中汽车的位置?如果是这样,您将如何解决这个问题?
我正在使用一个相对较小的数据集(50-100),大多数图像看起来类似于以下示例:
我最感兴趣的是只检测垂直坐标,而不是汽车的实际形状。例如,这是我想作为最终输出突出显示的区域:
是否可以分析图像并确定其中汽车的位置?如果是这样,您将如何解决这个问题?
我正在使用一个相对较小的数据集(50-100),大多数图像看起来类似于以下示例:
我最感兴趣的是只检测垂直坐标,而不是汽车的实际形状。例如,这是我想作为最终输出突出显示的区域:
您可以尝试具有对象检测 API 的 OpenCV。但是你需要“训练”它……通过为它提供大量包含“汽车”的图像。
查看上面的第二个链接,它显示了一个检测并在对象周围创建边界框的示例......您可以将其用作您想要做的事情的基础。
各种论文:
各种图像数据库:
1)您的第一张和第二张图片中有两辆汽车。
2)如果你只有 50-100 张图像,我几乎可以保证手动对它们进行分类会比编写或修改算法来识别汽车并提供坐标要快。
3)如果你决定用计算机视觉来做这件事,我推荐 OpenCV。教程在这里:http ://docs.opencv.org/doc/tutorials/tutorials.html
这是一个有监督的机器学习问题。您将需要使用具有 colinsmith 建议的学习算法的 API,或者自己进行一些研究和编写。Python 非常适合机器学习(这是我个人使用的),并且有一些不错的工具,例如 scikit:http ://scikit-learn.org/stable/
您可以使用 openCV latentSVM 检测器来检测汽车并在其周围绘制一个边界框:
http://docs.opencv.org/modules/objdetect/doc/latent_svm.html
无需使用 HaarCascade 训练新模型,因为已经有一个经过训练的汽车模型:
https://github.com/Itseez/opencv_extra/tree/master/testdata/cv/latentsvmdetector/models_VOC2007
我建议您查看 HAAR 分类器。由于您提到您有一组 50-100 张图像,您可以使用它来为分类器构建训练数据集并使用它来对图像进行分类。
您还可以查看指定问题的 SURF 和 SIFT 算法。