问题标签 [image-recognition]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
821 浏览

iphone - 识别面部并扭曲它

我们必须创建一个应用程序,它可以拍照、识别人脸并以某种方式扭曲它。下面是一个例子:

http://itunes.apple.com/us/app/fatbooth/id372268904?mt=8

有任何想法吗?是否可以仅使用 OpenCV 库?

0 投票
3 回答
1960 浏览

algorithm - 特定对象/图像识别任务的最佳方法?

我正在寻找照片中的某个物体:

对象:中间有 X 的矩形的轮廓。它看起来像一个矩形复选框。就这样。所以,没有填充,只有线条。矩形将具有相同的长宽比,但它可以是照片中的任意大小或任意旋转。

我看过一大堆图像识别方法。但我正在尝试确定最适合这项特定任务的方法。最重要的是,对象是由线条组成的,而不是填充的形状。此外,没有透视失真,因此矩形对象在照片中始终具有直角。

有任何想法吗?我希望我可以很容易地实现一些东西。

谢谢大家。

0 投票
1 回答
398 浏览

image - 你知道图像哈希库吗?

我正在寻找一个图像的“模糊”哈希库,这意味着即使有一些微小的变化(不同的压缩比、水印、小裁剪等)也可以识别图像的库

我找到了 pHash 库,但没有关于使用它的文档。

你认识一个吗?

0 投票
1 回答
321 浏览

ruby-on-rails - Web App的图标识别

我再一次为我的行人问题做出了最好的回答。我正在构建一个小型网络应用程序,通过识别应用程序图标的能力将大大改进。我已经搜索了所有内容,但没有找到任何适合我需要的东西。

基本经验:

  1. 用户上传截图

  2. 我们提取图标

  3. 我们返回对应app的名字

这里有几点:

  1. 所有图标都将从屏幕截图中获取。

  2. 所有图标将具有相同的像素宽度和高度。

  3. 所有图标都将从屏幕截图中的同一位置抓取。

  4. 所有图标都需要与图标库(大约 400 个左右)进行匹配。

该应用程序内置于 Rails 中,因此显然任何带有 ruby​​ 库的东西都是理想的,但是,我愿意考虑任何替代方法。

提前致谢,

哈里斯

0 投票
1 回答
325 浏览

.net - 使用 .NET 识别图像中特定尺寸的矩形

我想使用 .NET 的任何“ok”库来识别白色背景上黑色矩形的轮廓。

我知道这个问题:

.NET 有什么好的图像识别库吗?

我只想多了解一下图像识别库以及如何在这种特定情况下使用它们。

我理想的解决方案将采取以下形式:

给定两张图片;一个真实图像和一个控制图像,只有白色背景上的黑色矩形轮廓,返回真实图像中黑色矩形内的真实图像中的所有内容。

可以假设真实图像将具有与控制图像的一般大小和一般位置(但不准确)匹配的黑色矩形轮廓。并且在真实图像上的矩形之外通常应该是白色的,类似于控制图像。然而,任何图像都可以在黑色矩形内。

C# 源代码将是首选。我会接受只能识别精确图像的东西,只要库有一些我可以使用的模糊类型的函数来改进它并显示在它们的大致方向上。

0 投票
4 回答
18570 浏览

image - 静态图像的 OpenCV haar 训练

我试图训练用于卡片套件检测的haar级联分类器(没有旋转并且图像没有失真)

例如,我有文件 Clubs.png,其中包含白色背景 20x20 像素的俱乐部图像

这个教程太纠结了 http://note.sonots.com/SciSoftware/haartraining.html

我的图像仅在大小上有所不同,没有变形或倾斜。

我必须输入哪些命令才能获取 Clubs.xml 文件?

0 投票
4 回答
2505 浏览

python - 使用 Python 从图像创建数据集以进行人脸识别

我正在尝试用 Python 编写一个人脸识别程序(我将应用 k-nn 算法进行分类)。

首先,我将图像转换为灰度,然后用图像的像素(总共 128x128= 16384 个特征)创建了一个长列向量(通过使用 Opencv 的 imagedata 函数)

所以我得到了一个如下所示的数据集(最后一列是类标签,我只显示了数据集的前 7 个特征而不是 16384)。

但是当我将 k-nn 应用于这个数据集时,我得到了尴尬的结果。我是否需要对这个数据集应用额外的过程,而不是仅仅将图像转换为像素表示?

谢谢。

0 投票
4 回答
4561 浏览

image - 如何计算图像中“绿点”的数量?

嗨,我有一堆图像。让我们假设它们都具有相同的大小。这些图像具有黑色背景和一些代表荧光的准圆形绿色斑点。我必须计算每个图像的荧光量(百分比)。即绿点的面积。

知道如何做到这一点,例如在 Java 中吗?

0 投票
0 回答
699 浏览

java - 通过图像匹配找到图像在屏幕上的位置

我目前正在尝试用 Java 编写一个程序,该程序将执行一些宏,但是我需要这些宏能够找到位于我的屏幕上的某些图片。

Macro Schedule 中有一个函数,它几乎是 FindImagePos(myimage.bmp, tolerance(0-255)) 并在 1080P 时在大约 0.2 秒内定位图像,但该程序在 Macro Scheduler 中编写代码会很痛苦。图像没有以任何方式失真,除了轻微的颜色变化,这是宽容的地方,

前任。找到这个:http : //min.us/idivEC.png 在这些条中的每一个中 min.us/iR64a.png

我不认为我可以有效地编写这样一个函数,并简要浏览了 ImageJ 和 Neuroph,它们看起来很复杂而且过分,我想知道是否有更简单的东西。

关于如何编码的唯一理论是截取屏幕截图,将其转换为 2D RGB 数组,搜索行以查找样本图像中第一行的出现,并具有一定的宽容度(也称为容差),如果它在某种程度上匹配,那么检查该行下方的第二行,依此类推。

0 投票
2 回答
4423 浏览

c++ - Tesseract 或任何其他 OCR 库

我正在寻找如何在 C++ 中使用(和训练?)Tesseract 的解释/API 文档/示例,在 google Tesseract 页面上没有任何用处,但在网络上还没有找到。

任何有用的资源和经验都会受到欢迎,因为我不知道如何开始。

PS:

  1. 我愿意就其他图书馆提出建议。
  2. 只有免费的图书馆