问题标签 [object-recognition]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
c# - 找不到使 tessnet2 工作的方法
我创建了一个控制台应用程序。添加了对 tessnet2_32 的引用。
我也尝试更改"C:\temp\tessdata"
为
该tessdata
文件夹本身包含 9 个失败并被添加到所有这些位置:
但它总是存在于 .Init 行并带有一条消息:
我无法想象为什么它在我只有 C 的时候试图访问一些 Z 磁盘。或者我完全误解了这个错误。
有人可以逐步发布告诉我该做什么和/或我做错了什么吗?即使在阅读了 30 多个谷歌链接后,我也感到完全失落。
c++ - 使用 SURF 描述符的 miniflann.cpp 中的错误
这段时间我一直在使用 Opencv。这一次,我遇到了一个让我非常恼火的问题。事实上,我有一个模板图像,我想在我的相机流中使用匹配来识别它,但我遇到了这样的控制台错误:
事实上,这是代码,它编译得很好,但错误出现在执行中。
提前致谢
algorithm - 最佳拟合 2D blob 上的矩形
我有一个二进制 blob(见图),我想在它上面放置一个已知宽度和高度的矩形。
如何找到最佳拟合矩形,即最大前景像素在内部而最大数量背景像素在外部的矩形?
(这是我对最佳匹配的初步定义,我愿意接受其他建议)
我正在寻找已知大小的矩形,但如果有任意大小的解决方案,那也很好。
示例 blob:
我想找到这些矩形:
到目前为止我的想法包括
- 从最小的封闭矩形开始;但这不适合这些 blob
- 最大封闭矩形;同样的问题,另外我没有算法
- 用霍夫变换找到矩形边;数据太嘈杂了。
我意识到对于符合我的标准的同一个 blob 可能有多个矩形,理想情况下,我想要一些可以找到所有候选者的算法(认为因为这可能更难,我很乐意找到一种只找到一个候选者的方法) :
我主要使用 opencv 和 cvBlobLib 来处理我的数据,但我愿意接受任何通用解决方案。
matlab - 图像处理中的数字识别算法/指南
我正在努力学习图像处理,并在这方面为自己设定了一个目标。一个号码识别系统。
因此,我学习了 Alasdair McAndrew 的 An Introduction to Digital Image Processing with Matlab,并了解了诸如边缘检测、阈值、膨胀和腐蚀以及命中和未命中变换等内容。
现在的问题是,我很难想象这些工具将如何帮助我实现目标。
我还有许多其他关于图像处理的书籍,虽然他们都教如何腐蚀或膨胀,但没有人告诉我如果我想识别图像中的对象、数字或字符该怎么做。
这真的很令人沮丧,因为在网上查找可以为这个问题提供非常笼统和广泛的答案。
谁能告诉我如何从我使用这些技术在绘画中制作的图像中识别数字。
如果不是至少可以建议我一本书甚至一个领域,因为在看了很多书之后,我得到的印象是我看错了方向。
sift - 结合 5 个图像的 Sift 描述符
我想将同一对象的 5 个图像的描述符组合到一个描述符文件中,以便我可以在参考图像的任何视图中识别该对象。我需要消除从 5 个图像中保存的类似描述符的重复。我所需要的只是所有 5 个视图中对象的一组不重复的、唯一的描述符。我怎么才能得到它?
object-recognition - 从混淆矩阵到 ROC 图
我最近基于本文中描述的算法实现了一个词袋分类算法。
一切都很好,但我想使用 ROC 曲线或精确召回图来测量分类器的准确性。
我可以很容易地得到每个分类器的混淆矩阵,但我不知道我应该改变什么参数来获得更多的点并实际绘制曲线。
有人可以向我解释一下吗?
c++ - 查找立体图像中斑点的真实位置和大小
有没有人知道如何在立体图像中找到斑点或物体的大小?我知道立体图像输出深度信息,但我想知道检测到的物体有多大或多高。假设我在检测到的对象周围找到了一个边界矩形,该对象位于房间更远的位置。如何以厘米等度量单位找到边界矩形的高度?
opencv - 词袋训练样本
我已经实施了 Bag Of Words,一切都很顺利。但是,我对一些步骤以及如何实现它感到困惑。
我可以创建弓形描述符作为词袋中的最后一步来创建样本,如此处所示bowDE.compute(img, keypoints, bow_descriptor);
.. 事情是我对接下来的步骤感到困惑。
我知道在 BOW 中我必须用非类(可乐)训练和测试一个类(汽车),我在 bow_descriptor 向量中创建的仅用于类汽车,所以我有只属于汽车的样本的向量. 以下是我在训练和测试系统时遇到的问题。
1- 我应该将 bow_descriptor 的向量一半用于 class(cola) ,其余用于 non-class(cola) ,还是我必须为 non-class(cola) 创建一个新的 bow_descriptor ?
2-我需要做多类分类,在完成第一个类(汽车)系统后,我需要训练一个新类(公共汽车+火车等),我应该为每个人创建一个新的训练模型吗, 或者可以和之前的培训一起做培训程序(即培训班BUS,与班车在同一系统中培训)?
opencv - 如何在 OpenCV 中使用计算机视觉检测飞镖板上的飞镖?
我是计算机视觉世界的新手。这是我需要做的。给定一个图像,在图像中包含对象 A 的所有位置周围挑选并画一个圆圈。换句话说,假设射击板上有 3 个飞镖,我想返回它们的位置。我将如何使用 OpenCV 做到这一点?我必须使用的技术的名称是什么。我想知道要熟悉库的哪些部分才能实现此功能。
opencv - 使用筛选描述符进行对象识别
我是该领域的新手。我的问题是识别与训练图像中使用的对象(相似对象的图像)相似的对象是否存在于测试图像中。我想使用 SIFT 描述符进行识别。通过将用于将对象分类为不同类别的 SIFT 描述符进行聚类的词袋方法是否适合它,或者是否有更简单的方法使用 sift 描述符。提前致谢