问题标签 [object-detection]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
c# - 车牌检测有哪些好的算法?
背景
对于我在大学的最后一个项目,我正在开发一个车牌检测应用程序。我认为自己是一名中级程序员,但是我的数学知识缺乏中学以上的任何知识,这使得生成正确的公式比应该做的更难。
我花了很多时间查找学术论文,例如:
说到数学,我迷路了。由于这项测试,各种图形图像被证明是有效的,例如:
到
然而,这种方法只适用于该特定图像,如果将这些技术应用于不同的图像,我确信会发生较差的转换。我读过一个名为“底帽形态变换”的公式,它执行以下操作:
基本上,变换保留了图片的所有暗部细节,并消除了其他一切(包括更大的暗区和亮区)。
我找不到这方面的太多信息,但是报告末尾附近的文档中的图像显示了它的有效性。
其他约束
- 用 C# 开发
- 将项目仅限于英国车牌
- 我可以选择要转换的图像作为演示
问题
我需要关于我应该专注于开发哪些转换技术以及哪些算法可以帮助我的建议。
编辑:新信息出现在续 - 车辆牌照检测
c# - 续 - 车牌检测
从这个线程继续:
我开发了我的图像处理技术来尽可能地强调车牌,总的来说我很满意,这里有两个示例。
现在是最困难的部分,实际检测车牌。我知道有一些边缘检测方法,但我的数学很差,所以我无法将一些复杂的公式翻译成代码。
到目前为止,我的想法是遍历图像中的每个像素(基于 img 宽度和高度的循环)由此将每个像素与颜色列表进行比较,由此检查算法以查看颜色是否在许可证之间保持区分盘子白色,文字黑色。如果发生这种情况,这些像素会被构建到内存中的新位图中,那么一旦停止检测到该模式,就会执行 OCR 扫描。
我很感激对此的一些意见,因为这可能是一个有缺陷的想法,太慢或太密集。
谢谢
opencv - opencv中的快速运动和物体检测
我们如何同时检测快速运动和物体,让我举个例子,....假设有一个足球比赛视频,我想以最大准确度检测每个球员的位置。我正在考虑人体检测,但如果我们看到足球比赛视频,那么人类检测就没有任何意义,因为我们可以将人类视为对象。也许我们可以通过 blob 检测来做到这一点,但 blob 存在很多问题,例如:-
1)我想把每个玩家分开。因此,如果玩家发生碰撞,那么斑点检测将无济于事。所以单独识别球员会有问题 2)其次是体育场灯的问题。
那么是否有任何特定的算法或方法或库来做到这一点..?我看过一些研究论文但不满意...所以建议任何与此相关的内容,例如任何文章、算法、库、任何方法、任何研究论文等,并请大家在此发表您的看法。
android - 如何在opengl Android中进行对象检测?
自 2 周以来,我就开始使用适用于 Android 的 OpenGl es,在尝试了 3D 示例之后,我对对象检测感到困惑。基本上屏幕的 x,y 坐标与 3d 空间的 x,y,z 之间的映射,反之亦然。
我碰到 :
GLU.gluProject(objX, objY, objZ, model, modelOffset, project, projectOffset, view, viewOffset, win, winOffset);
GLU.gluUnProject(winX, winY, winZ, model, modelOffset, project, projectOffset, view, viewOffset, obj, objOffset);
但我不明白我该如何准确地使用它们?
如果您能用合适的例子详细说明,请提前致谢。:)
image-processing - 定向梯度直方图
我一直在阅读有关用于对象(人类)检测的 HOG 描述符的理论。但是我对实现有一些疑问,这听起来可能是一个无关紧要的细节。
关于包含块的窗口;窗口是否应该逐个像素地移动到图像上,在每个步骤中窗口重叠,如下所示:
或者应该移动窗口而不引起任何重叠,如下所示:
到目前为止,我看到的插图使用了第二种方法。但是,考虑到检测窗口的大小为 64x128,通过在图像上滑动窗口,很可能无法覆盖整个图像。如果图像大小为 64x255,则不会检查最后 127 个像素是否有对象。所以,第一种方法似乎更合理,但是,更多的时间和 CPU 消耗。
有任何想法吗?先感谢您。
编辑:我尽量坚持 Dalal 和 Triggs 的原始论文。可以在此处找到实现该算法并使用第二种方法的一篇论文:http ://www.cs.bilkent.edu.tr/~cansin/projects/cs554-vision/pedestrian-detection/pedestrian-detection-paper.pdf
opencv - 我应该使用什么样的描述符来检测海豹幼崽?
我有一个项目来检测和计算从海滩拍摄的航拍图像中的海豹幼崽(动物)。与棕色和大的成年海豹相比,海豹幼崽是黑色和小。
一些海豹幼崽被重叠/部分遮挡。海滩颜色接近黄色,但有一些黑色岩石增加了检测难度。
什么样的描述符最适合我的项目?HOG、SIFT、Haar 类特征?
我在问这个问题的理论部分。我认为要实现我的项目,第一步应该是选择最能代表对象的正确描述符,然后(结合几个弱特征,不是必需的吗?)使用机器学习方法训练分类器,如 boosting/SVM/neural_network,对吗? ?
示例图片:
image-processing - 多尺度定向梯度直方图(均值偏移?)
我正在研究 HOG 描述符,除了检测窗口的融合之外,我已经完成了大部分部分。
到目前为止我所做的是;我构建了图像的尺度空间金字塔,对于每个尺度上的每个图像,我移动检测窗口(64x128)并检测人类。在每张图像中,一个人被多个窗口检测到。
所以问题是如何将所有这些窗口(假设一个人)融合到一个窗口中。Dalal 建议应该使用稳健的模检测算法,例如均值偏移。但是,我有多个尺度......我是否应该首先估计在尺度空间的较低级别中发现的检测窗口的真实位置才能做到这一点?
任何帮助表示赞赏。提前致谢。
opencv - 使用 OpenCV 进行“对象放置在顶部”检测
我是计算机视觉领域的新手,我想解决以下任务(最好使用 OpenCV 和 C#,但也非常欢迎使用 Scilab 等其他解决方案):
场景中有一些参考对象,例如手(或多或少是静态的) - 相机正在俯视该对象。现在我想识别我的手上是否有东西(它是否改变了我手的整体形状,或者它是否像坐在我的手掌中一样小)。
此任务仅用于演示目的,因此我希望尽可能少地使用。我想用静态图片训练它并在真实环境中使用它。
任何帮助、提示或如何解决这个问题的步骤都非常感谢。先感谢您!
opencv - 使用 openCV 进行自然特征跟踪 - 评估选项
简而言之,使用 OpenCv 在网络摄像头提要中实现对特定图像(照片/图形/徽标)的跟踪有哪些可用选项?特别是我试图整理关于以下内容的意见:
HaarTraining 会过分杀伤(考虑到它不是 3d 对象,而只是要跟踪的图像)还是唯一的出路?
已经尝试过模板匹配、基于颜色的检测,但这些都不能在不同的照明/比例/方向下提供可靠的跟踪。
- SIFT、SURF 特征匹配在视频中的工作与静态图像比较一样可靠吗?
我是 OpenCV 的相对初学者,这从我之前对 SO 的查询中可以看出(非常有用的回复)。任何线索或链接都可能是使用 OpenCV 开始 NFT 实施的好资源?
kinect - 我可以使用 Kinect 来识别物体吗?
铁塔决定了一条路径。我希望 Kinect 检测到塔架,这样我就可以让我的机器人留在路径内。Kinect 是否能够进行对象检测,是否有这方面的教程。