问题标签 [object-recognition]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
computer-vision - OpenTLD,它与其他对象检测方法有何不同?
对于那些听说过 OpenTLD 的人,它是如何在跟踪不同对象之间交替进行的?它一次只能跟踪一个对象,但如果我在同一个视频源中训练了两个或多个对象,OpenTLD 如何决定跟踪什么?在所有示例视频中,用户手动限制要跟踪的对象,然后自动跟踪。
这是否仅被视为对象跟踪器?而不是物体识别系统?我对此有点困惑。
对于我的应用程序,我可以一次跟踪/检测一个对象,但前提是我可以选择切换到跟踪另一个对象。
例如,在类似 Haar 的特征设置中: 1. 我有一个杯子和一本书,使用多个正面和负面训练 2. 启动我的 Haar 识别软件,该软件同时拾取杯子和书籍,并用正确的标签
理想情况下,我认为/希望/希望 OpenTLD 所做的是: 1. 使用已编译的 exe,在视频中绑定杯子,跟踪和学习 2.在视频中的下一个绑定书籍,跟踪和学习 3. 在包含书籍和杯子的视频源中,我告诉程序告诉我它可以在实时视频源中检测到的所有对象。4. 程序告诉我它检测到杯子和书本并让我选择跟踪其中之一
这可行吗?
image-recognition - 开源对象识别算法
我一直在对用于我的对象识别程序的正确算法进行大量搜索。但我发现的所有东西都有一些重大缺陷。
我的程序应该在遇到新对象时在线学习它们。当它遇到一个新对象时,会在其上设置一个框并学习该对象(OpenTLD 完美地做到了这一点)。对不同的对象重复这 1000 次,程序应该能够识别 1000 次对象的类和实例(类似 Haar 的特征级联可以做到这一点,OpenTLD 失败)。该算法必须是尺度和方向不变的(Haar 失败)。
我发现的所有东西都只能满足上述一些标准,而其他标准则不合格。令人惊讶的是,我还没有遇到任何可以满足所有标准的东西。我只在上面提到了 Haar 和 OpenTLD,因为它们是最接近我需要的。其他算法,如 SIFT、SURF 离我需要的更远。
所以我的问题是,是否有任何现有的源代码可以满足我的需要?或者,如果只是修改现有的源代码,我会有更好的运气吗?
opencv - 仿射SIFT(ASIFT)特征检测器
我正在做一个项目,我必须检测对象的特征(在视频帧中)并将其与其他对象(在其他帧内)匹配以识别相同的对象进行跟踪。我用谷歌搜索了许多特征检测器算法。我还对它们进行了一些比较(SIFT、SURF 和 ASIFT)。
ASIFT 在计算上有点昂贵,但与 SIFT 和 SURF 相比,结果更准确。我在谷歌上搜索了很多关于 ASIFT 的信息,但我的项目没有取得任何成功。
有人可以帮我在我的项目中使用 ASIFT 吗?
ASIFT 参考: http ://www.ipol.im/pub/algo/my_affine_sift/
我应该在我的项目中包含哪些文件?我正在开发 OPENCV 2.1,IDE VS 2010。这是我在这个平台上的第一篇文章。希望有人能帮助我。
iphone - 是否存在用于增强现实服务的免费 API?
目前我正在尝试为 iPhone 创建一个应用程序,该应用程序能够识别图像上的对象,例如汽车、公共汽车、建筑物、桥梁、人等,并在 Internet 的帮助下标记为对象名称。
是否有任何免费服务可以解决我的问题,因为对象识别本身就是一个复杂的算法,需要数字图像处理、神经网络等等。
这可以通过API完成吗?
image-processing - 如何从图像中提取特征进行分类和对象识别?
我对制作“特征提取”方法的方式感到困惑我想使用 SVM 在图像中应用“对象识别”,Emgu 的示例中有一个示例,其中包含一个包含猫特征的 XML 文件!一周以来我一直在尝试了解他们是如何做到的以及他们使用了哪些方法,我发现了这个页面 http://experienceopencv.blogspot.com/2011/02/learning-deformable-models-with-latent。 显示步骤的html !这太复杂了,而且我自己做不到,我很迷茫!谁能告诉我一种合适的“特征提取”方法与 SVM 学习兼容?雅阁有支持向量机的例子,但它是手写的,不处理彩色图像=(任何帮助链接?谢谢
image-processing - 几个简单对象的实时跟踪算法
我正在尝试编写一个程序来跟踪某些对象的相对位置,同时我正在玩流行的游戏英雄联盟。具体来说,我想跟踪屏幕上当前任何“奴才”的 x、y 屏幕坐标(“奴才”是图片中心的小家伙,头上有红色和绿色的小条)。
我目前正在使用 Java Robot 类在我玩游戏时将屏幕截图发送到我的程序,并试图找出最好的算法来定位小兵并跟踪它们,只要它们留在屏幕上。
我目前的想法是使用卷积神经网络通过头上的彩色条来识别和定位奴才。但是,我必须在每个新帧上重新识别和定位小兵,如果我想实时执行此操作(~10-60 fps),这似乎在计算上会很昂贵。
这些类型的计算机视觉算法并不是我真正的专长,但存在利用视频中对象以连续方式移动的事实的算法似乎是合理的(即它们不会从帧跳到帧)。
那么,是否有一种易于实现的算法来完成这项任务?
image-processing - 将灰度图像中的对象编写为零一数组[]
我正在尝试将捕获的图像中的灰度对象编写为 0 1 的矩阵,表示对象像素块(或类似对象样式缩放),我可以想象通过循环对象、缩放和写入矩阵来进行手动处理根据颜色的等级,但是我正在寻找智能或开源工具,
.NET 是首选,
[更新,更详细地解释]
原始图像是彩色的,但是,我将其转换为 256 灰度,然后我只想将其缩放为黑色或白色,所以最终它只是一张黑白图片,我想将其转换为零 -一个矩阵,
以下网址包含有关如何使用名为 imagemagick 的软件将黑白图片转换为零一矩阵的讨论:
http://studio.imagemagick.org/discourse-server/viewtopic.php?f=1&t=18433
注意展示龙脸图像的零一矩阵!有没有任何技术或开源工具可以帮助我实现这一目标?
kinect - Kinect 物体识别
我正在做一个需要识别平面和小物体的 Kinect 项目。我打算在mac机器上使用openni。那么我需要使用哪些库来进行对象识别呢?我必须知道什么知识才能完成这个项目。
image-processing - 使用opencv检测圆圈图案
我必须使用opencv检测6个圆圈的图案。我通过在 opencv 中使用阈值和轮廓函数检测到圆及其质心。
现在我必须以一种对缩放和旋转不变的方式来定义这些圆之间的关系。有了这个,我将能够在各种视图中检测到这种模式。我必须使用此模式来确定对象姿势。
如何实现缩放/旋转不变性?你有什么我可以读到的参考吗?
computer-vision - 具有 SIFT 类似特征的 CBIR,离散方法与连续方法
目前我正在处理实现一个用于对象识别的 CBIR 系统(详细的对象分类),现在因为我有一些工作的特征检测器和描述符,我试图找到处理这些特征的最佳方法,以完成基于内容的任务图像检索。
据我所知,这项任务有两个主要趋势,离散方法和连续方法。离散代表方法,如视觉词袋和码本,用于建立反向索引以应用引用文本检索的方法,而连续代表方法,如使用 kd 树和最近邻分类的 Best Bin First 搜索。
所以这两种方法之间的一个主要区别是,一种使用视觉词等特征的额外表示,另一种使用从描述符计算的 nD 特征。
我现在的问题是,这两种 CBIR 方法之间是否有任何比较可以帮助我找到适合我的任务的最佳方法?