问题标签 [pattern-recognition]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
image - 寻找图像比较/模式识别库
最终目标是看看是否
包含
.
比较需要支持轻微的失真、缩放、颜色差异、旋转和亮度差异。
它真的可以是任何语言。我将把这个算法作为一个 web 服务运行,所以如果我必须用 c、c++、python 等编写这部分是没有问题的。
image-processing - 在图像中查找网格
拥有三消游戏截图(例如http://www.gameplay3.com/images/games/jewel-quest-ii-01S.jpg),找到网格绑定框的正确方法是什么(带瓷砖的桌子)?棋盘不必是完美的矩形(如屏幕截图所示),但每个单元格都是完全正方形的。
我尝试了几款游戏,发现可以进行一些游戏中的图像转换来增强网格内的图块(例如在这个游戏中,将 V 通道从 HSV 颜色空间中取出就足够了)。然后我可以放大瓷砖使它们重叠,找到图像的最大轮廓并从中获取绑定框。
上述方法的问题是每个游戏(甚至同一游戏中的关卡)可能需要不同的转换来获得瓷砖。所以问题是 - 有没有一种标准的方法来增强网格内的瓷砖或网格线(我试过用霍夫变换找到线,但是,虽然网格看起来很明显,霍夫没有找到它) ?
另外,如果使用手机摄像头而不是桌面截屏来获取屏幕截图怎么办?根据我的经验,拍摄的图像颜色不太清晰(取决于照明),并且可能会有点失真,因为无法将手机完全放在屏幕前。
video - 在视频中找到有区别的关键帧的好方法是什么?
我需要从特定人类动作的视频中提取单个“关键帧”(这些动作可能是通用的),使其具有区分性而不是描述性(在视频中寻找有趣的帧)。
简而言之,我需要在篮球视频中找到一个能够将其与喝咖啡视频区分开来的帧。
我看到的大多数论文都是某种视频摘要技术,但这样提取的帧不一定是区分动作类别的最佳选择。这是我的绊脚石——在测试期间,我只有测试视频来提取关键帧,但我需要一些模型来提取与其他动作类别视频最不同的帧。
image-processing - 推荐一个库(一个API)来识别图片中的形状
我需要一个库(带有 API),它可以将图像作为输入并从中识别形状,返回形状的坐标。
库的部署必须简单,以 DLL 的形式而不是完整的应用程序(例如 Mathematica)。
它不一定是完美的,形状的近似值很好,但它不应该输出重叠的形状。
这是输入图像的示例
image-processing - 将PNG图像转换为像素灰度值特征向量
我是 MATLAB 的新手,我有一组 bmp 图像,我需要将其转换为像素灰度值作为图像的特征向量。谁能建议我如何做到这一点?我需要将这些像素灰度值用作特征,然后执行 PCA/LDA 之类的操作。我尝试了 imread() 但它返回了一个矩阵。我觉得特征向量将只是一个行向量。
问候,
sql - 我可以使用哪种算法来查找常见的相邻单词/模式识别?
我的数据库中有一个大表,其中包含来自文本顺序中各种文本的大量单词。我想找出某组单词一起出现的次数/频率。
示例:假设我在许多文本中有这 4 个单词:United | States | of | America
. 我会得到结果:
美国: 50
美国: 45
美国: 40
(这只是一个4个单词的例子,但可以有少于和多于4个)。
有一些算法可以做到这一点或类似的吗?
编辑:欢迎使用一些显示如何操作的 R 或 SQL 代码。我需要一个实际的例子来说明我需要做什么。
表结构
我有两张桌子:Token
which hassid
和text
. 文本是 is UNIQUE
,并且该表中的每个入口代表一个不同的单词。
TextBlockHasToken
是保持文本顺序的表格。每行代表文本中的一个单词。
它textblockid
具有令牌所属的文本块。sentence
那就是token的句子,position
就是token在句子里面的位置tokenid
,就是token表的引用。
ocr - 贝叶斯类的数字识别
我只需要为数字编写一个 OCR 程序。我将使用 MNIST 数据集。问题是我不知道从哪里开始。有很多论文并没有真正解释算法。我对模式识别知之甚少。所以我有几个问题。
Q1:在哪里可以找到算法(或教程) Q2:如何对数字进行分类?我不需要很高级的东西。我想到的第一件事是找到上半部/下半部和左侧/右侧的比率。有没有更有用更简单的分类方法。Q3:什么是反向传播以及大多数论文中显示的层。我的简单 OCR 是否需要它们。
注意:我知道我的 OCR 程序不会准确。暂时不是很重要。
regex - Blackberry Bold - 无法识别 URL 甚至注册的自定义模式
我们有一个黑莓本机应用程序部署在BB Bold 9700 (OS Version: 5.0)
该应用程序注册了表单的自定义模式string://[0-9]*
。与模式匹配的字符串会突出显示,但应用程序未收到完整的字符串
此外,当 URL 被识别并突出显示时,启动时,BB browser
它只接收部分字符串 -http://
仅观察到此错误BB Bold 9700 (OS Version: 5.0)
。
还有几个问题
- 有没有办法找到在黑莓设备上注册的所有系统模式?
- 如果文本与多个模式匹配,黑莓如何解决冲突?
在我的情况下,两个文本“ http://urlline
”和“ ”分别string://customtext
被剪裁为“ http:// and string
”。
java - Real-time identification of non-speech, non-music sound from a continuous microphone stream
I'm looking to log events corresponding to a specific sound, such as a car door slamming, or perhaps a toaster ejecting toast.
The system needs to be more sophisticated than a "loud noise detector"; it needs to be able to distinguish that specific sound from other loud noises.
The identification need not be zero-latency, but the processor needs to keep up with a continuous stream of incoming data from a microphone that is always on.
- Is this task significantly different than speech recognition, or could I make use of speech recognition libraries/toolkits to identify these non-speech sounds?
- Given the requirement that I only need to match one sound (as opposed to matching among a library of sounds), are there any special optimizations I can do?
This answer indicates that a matched filter would be appropriate, but I am hazy on the details. I don't believe a simple cross-correlation on the audio waveform data between a sample of the target sound and the microphone stream would be effective, due to variations in the target sound.
My question is also similar to this, which didn't get much attention.