问题标签 [pattern-recognition]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
2199 浏览

neural-network - 用于模式识别的神经网络

嘿,伙计们,
我想知道是否有人可以帮助我设计一个可以识别视觉模式(例如检查和剥离)的神经网络系统的起点。我有理论知识,但很少有实践知识。网络搜索给了我信息超载。任何人都可以推荐一本更注重实际方面的好书或教程。
谢谢!

0 投票
4 回答
21592 浏览

image-processing - 解释霍夫变换

我只是在冒险,并迈出了迈向计算机视觉的第一步。我试图自己实现霍夫变换,但我只是不明白整个画面。我阅读了维基百科条目,甚至阅读了理查德杜达和彼得哈特的原始“使用霍夫变换检测图片中的线条和曲线”,但没有帮助。

有人可以用更友好的语言向我解释吗?

0 投票
1 回答
263 浏览

algorithm - 从动态无序集中预测模式的概率

假设用户可以输入三个不同元素之一:{A, B, C}

当用户继续输入这些值时,有没有办法预测下一个值是哪个值,接下来是哪个值,接下来是哪个三个值的概率?

如果是这样,请您参考我可以阅读的算法吗?或者一些代码示例?

0 投票
4 回答
3028 浏览

c++ - 如何使用 OpenCV 在 COD 中搜索玩家模型

我正在尝试创建一个程序,可以在使命召唤游戏的视频中找到人物。我已经从该视频中编译了大约 2200 张单独图像的列表,这些图像要么包含人物,要么不包含人物。然后我尝试训练一个神经网络来区分两组图像之间的差异。

然后,我将每个视频帧分成几百个网格矩形,并用我的 ANN 检查每个。矩形重叠以尝试捕获网格矩形之间的图形,但这似乎效果不佳。所以我有几个问题:

  1. 神经网络是要走的路吗?我读到它们与其他机器学习算法相比非常快,最终我计划将其用于实时视频,速度非常重要。

  2. 搜索图像帧中的数字以在 ANN 上测试的最佳方法是什么?我觉得我做的方式不是很好。它绝对不是很快或准确的。960 x 540 的图像每帧大约需要 1 秒,并且精度很差。

  3. 我遇到的另一个问题是构建特征向量以用作 ANN 输入的最佳方法。目前,我只是将所有输入图像缩小到 25 x 50 像素,并创建一个包含每个像素强度的特征向量。这是一个非常大的向量(1250 个浮点数)。构建特征向量的更好方法是什么?

有关我在这里所做的更详细的解释:CodAI:计算机视觉

编辑:我想要更多细节。计算特征的最佳方法是什么。我需要能够识别许多不同位置的人物。我是否需要创建单独的分类器来识别直立、蹲伏和俯卧之间的区别?

0 投票
3 回答
14322 浏览

opencv - OpenCV 中的人脸识别

我试图使用 OpenCV 2.2(来自 Willow Garage)构建一个基本的人脸识别系统(PCA-Eigenfaces)。我从之前关于人脸识别的许多帖子中了解到,没有标准的开源库可以为您提供所有的人脸识别。

相反,我想知道是否有人使用过这些功能(并集成了它们):

等人在eigenobjects.cpp形成一个人脸识别系统,因为这些功能似乎提供了许多所需的功能以及cvSvd

因为我是 OpenCV 的新手,所以我很难理解这样做。

0 投票
1 回答
368 浏览

ocr - OCR 符号与非符号检测/识别

在 OCR 应用程序中,您通常会找到图像的连接组件并在这些组件上运行 OCR 引擎以识别它们。

我的问题是,如果您的连接组件具有训练集中不存在的符号/形状,应该怎么做。

例如,如果我们正在运行数字识别并且图像具有直线或字符,则说“X”或其他任何不是数字的东西。

你怎么知道它不是一个数字?

0 投票
2 回答
11382 浏览

image-processing - 在图像中查找重复的图案/图像

我一直在寻找有关此主题的一些论文(或信息)。

为了避免误解:我不是在谈论在多个位置找到提供的模式。

重复图案也可以理解为重复图像。这里对模式的定义不是抽象的。例如,想象一堵砖墙。墙壁由单独的砖块组成。墙壁的图片由砖的重复图像组成。

解决方案必须最好找到最大的重复模式。在这种情况下,大可以通过两种方式定义:像素面积或重复次数。

在上面的示例中,您可以将砖块切成两半。为了制作砖块,您可以旋转一段并连接两半。虽然就像素面积而言,完整的砖块是最大的重复图像,但半块的重复次数要多 2 倍。

有什么想法吗?

0 投票
1 回答
1381 浏览

java - 安卓视频识别

我试图用谷歌搜索,希望能找到任何类似于 Google Goggles 的工具/库,这些工具/库在某种程度上允许开发人员识别视频中的对象。

我知道这是一个复杂的话题。

是否有任何库可以识别视频中的形状?例如检测给定帧/视频中是否有任何方块?我很确定 Goggles 可以做到这一点,但根据我的研究,它没有 SDK 可供使用。

更新识别器似乎是我想要完成的一部分的一个很好的例子。但这是一个尚未发布的应用程序。

0 投票
3 回答
3690 浏览

opencv - OpenCV 2.2 PCA 和 EigenFaces

我只是想知道 OpenCV 2.2 中的 cv::PCA::PCA 构造函数方法是否会减去均值,或者我是否必须传递已减去均值的数据。

我测试了两种方式,但是在可视化特征面时,它们都没有给我很好的结果,只是一个黑屏。我没有分段错误或错误,只是没有像论文中那样获得特征脸可视化。

0 投票
3 回答
2091 浏览

classification - C5算法实现?

你知道我在哪里可以找到这个算法的一些资料,来研究它吗??是否已经有它的实现示例,或者只有Quinlan知道它的实现?