问题标签 [object-detection]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
136 浏览

c++ - 你使用什么类型的负面图像进行类似 Haar 的特征训练有关系吗?

我正在尝试使用 OpenCV 进行一些对象跟踪,并且我阅读了一些关于 Haar 类功能的信息。它说我需要大约 5000 - 10000 张负片图像才能做到这一点,我使用的图像越多,结果就越准确。但我想知道我使用什么类型的图像有关系吗?

例如,我将在房间内跟踪物体,那么只获取室内环境的负片图像会更好吗?或者它并不重要,因为它只是负面的?

如果这听起来像一个愚蠢的问题,我深表歉意,但我想 100% 确定这一点,以确保我的结果尽可能准确。

谢谢

0 投票
1 回答
1407 浏览

android - 如何从包含大量其他数据的图像中提取 android 上的 QR 标签?

我想从包含大量数据的图像中提取 QR 标签。类似于 OpenCV 的对象检测。检测到图像包含二维码标签后,应将其提取、放大并保存。让解码器对其进行解码。是否可以?

0 投票
2 回答
2346 浏览

image-processing - 如何训练 HOG 描述符?LOGO识别/标志识别..

我正在寻找一些可以为某些对象训练 HOG 描述符的工具/软件。或者如果有任何直接的教程可以做到这一点,请提供它的链接。或建议我如何训练猪描述符。基本上我的目标是从电视图像中检测频道的标志。节目的图像(上电视)是从相机拍摄的。.. 这个图像是我们程序的输入,用于识别拍摄图像的通道。我尝试了基于 surf/shift 的功能,但这些对于匹配模式与 3000 个图像(每个频道 10 个图像)的模式非常慢。而基于 haar 的功能需要大量时间来训练超过 300 个电视频道。我们需要接近实时(< 2 秒)的程序性能..

0 投票
3 回答
1143 浏览

matlab - HOG 描述符训练需要多长时间?

我们有一个项目可以从图像中识别徽标。我们最初使用 Haar 分类器,但训练 Haar 分类器需要大量时间(在我们的 Core i5 机器上每个徽标需要 4 天)。为 300 多个徽标训练它需要很长时间(我们没有任何高性能计算机)。因此,我们决定转向基于 HOG 的目标检测器,希望它的训练时间会大大减少。

有谁知道 HOG 描述符训练需要多少时间?我们将针对每个徽标(在配备 Core i5 处理器的机器上)大约 100 个正面和 100 个负面 600x800 像素图像进行训练。

0 投票
1 回答
11289 浏览

opencv - 使用 SURF 在检测到的对象周围绘制矩形

我正在尝试从以下涉及冲浪检测器的代码中检测对象,我不想绘制匹配项,我想在检测到的对象周围绘制一个矩形,但不知何故我无法获得正确的 Homography,请任何人指出在哪里我错了。

0 投票
1 回答
24385 浏览

opencv - 简单的 OpenCV 项目 - 检测和跟踪网球

我有一个项目,我需要使用 OpenCV 来检测网络摄像头上的物体(网球),并在我将它滚过桌子时跟踪它以获得奖励积分。

由于我使用的是 OpenCV 2.4、C++,而且很多信息都在较旧的 OpenCV 版本中,因此我没有太多运气找到这方面的信息。我已经阅读了很多不同的方法来做到这一点,但我只是不知道如何在我的代码中实现它。

任何帮助将不胜感激,特别是关于如何将检测/跟踪功能集成到我的代码中

到目前为止,这是我的代码,我认为图像检测/跟踪代码应该在我应用过滤器之后执行:

0 投票
1 回答
18009 浏览

image-processing - 如何使用 OpenCV(模板匹配)检测和匹配标记

我正在使用在特定区域保存标记的图像。我尝试使用模板匹配来做到这一点,这是在 opencv 中定义为 cvMatchTemplate 的方法。

我正在使用网络摄像头来检测它们,目前程序正在检测标记,因为我提供了与模板相同的标记。

但是我找不到一种方法来检查它是最佳匹配还是稍微匹配。因为在 cvMatchTemplate 中,它不仅检测最佳匹配,还不断检测稍微匹配的区域。

谁能告诉我一种方法来做到这一点。或者如果我的问题有其他方法,请告诉我!

这是我的图像卡的链接 http://imageshack.us/photo/my-images/266/piggycard.jpg/ (我想检测并检查它是否经过加工)

这是代码

// template_mching_test_2.cpp : 定义控制台应用程序的入口点。//

作为模板,我提供了从原始图像中裁剪的相同标记。从 minMaxLoc 我取最大值来检查最佳匹配。但是当图像标记在某个位置时,它会一直给我相同的值,并且当图像标记不在框架中并且在先前与标记匹配的位置略微匹配时。minMaxloc 是否给我们的坐标(位置)标记或匹配百分比。或者有没有其他方法。谢谢您的考虑。

0 投票
1 回答
1999 浏览

c++ - OpenCV Haar 分类器阈值

我正在尝试理解 oepncv XML haar 分类器,它看起来像这样:

如原始论文中所述,阈值应与特征(积分图像)的总和进行比较。但是,图像的像素值应为 0 - 255(灰度图像)。一个特征的总和怎么会那么小(例如在这个特征中,阈值是 0.004014...)?你们能给我一些方向来理解吗?

感谢您的帮助!

0 投票
2 回答
3067 浏览

opencv - 在 C++ 中使用 OpenCV 进行对象检测

我目前正在为我正在建造的无人机开发视觉系统。该系统的目标是在视频流中找到定义相当明确(见下文)的目标对象,该视频流将是地面的二维飞越视图。到目前为止,我已经尝试过训练并使用基于 Haar 特征的级联(la Viola Jones)来进行检测。我正在使用 5000 多张不同角度(透视偏移)和范围(框架中的大小)的目标图像进行训练,但只有 1900 张“背景”图像。这根本不会产生好的结果,因为我找不到合适数量的级联级联来平衡少量误报和少量误报。

我正在向在这方面有经验的人寻求建议,关于我是否应该:1)放弃级联,转而采用更适合由其轮廓和颜色定义的对象的东西(我读过 VJ 级联是不是)。2)改进我的级联训练集,或者通过添加正面、背景帧、更好地组织/拍摄它们等。3)我目前无法理解的其他一些方法。

目标描述:

  • 主要形状:三角形、正方形、圆形、椭圆形等。
  • 不同的、纯色的、原色(或接近)的颜色。
  • 最小尺寸在 2 到 8 英尺之间(大到足以从几百英尺的 AGL 上轻松看到)
  • 对象中心的大而单一的字母数字,具有自己独特的、纯色、原色或几乎原色。

我的目标是使用非常快速的东西,例如 VJ 级联,来找到可能的对象及其相关的边界框,然后将它们传递给更精细的处理例程以确定属性(对象的颜色和 AN,AN 的值,实际形状和 GPS 位置)。您可以为我完成此目标提供的任何建议将不胜感激。我目前拥有的源代码在这里发布有点长,但如果您想查看它以供参考,可以免费获得。提前致谢!

-JB

0 投票
2 回答
529 浏览

android - 是否有适合在已知环境中识别对象的图像处理库/AR 技术?

我需要检测场景中的对象(在 iPhone 和 Android 上)。环境以一种应该使问题更容易和更准确的方式受到约束:

  1. 环境小而知名......用户正在探索一个我可以提前拍照的单间或小的户外区域,以“训练”或约束算法
  2. 用户在空间内的位置通常是有限的......即使空间很大,用户也可能被限制在空间内的特定路径中
  3. 被检测到的物体是相对静止的……它们是环境的一部分,不会移动

但是,使问题变得更加困难:

  1. 我无法通过在对象上放置标记来修改环境,因此我需要识别对象本身
  2. 这些对象看起来非常相似,因此我们可能必须使用周围场景作为输入,而不仅仅是单个项目

例如,想象一下沿着一条小路穿过一座历史悠久的墓地(您不允许在草地上行走)。当用户将手机指向墓碑时,我希望能够识别墓碑并估计用户相对于墓碑的位置(这样我就可以估计用户在路径上的位置)。如果你只看墓碑,许多墓碑看起来都非常相似。提前我可以走那条路,从不同的角度为物体拍摄多张照片。

是否有适合此类对象检测问题的算法或库?