问题标签 [pattern-recognition]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
java - Java 字符串模式识别
我有一个大约一千个字符长的字符串,由 L、T 和 A 组成。我很确定其中有一个简单的模式,我想知道是否有任何快速简便的方法可以找到它。这个字符串发生了变化,因此这不仅仅是一个关闭。
我正在寻找的模式是,例如,如果字符串是
子字符串LLLLLAATAALL
在此字符串中重复 4 次。我想搜索这样的子字符串,但我不知道它们从哪里开始、结束、有多少以及它们在主字符串中的长度。
如果Java中有任何工具可以寻找这种东西,任何建议都将不胜感激。
nt
machine-learning - 新手:给定一个预测未来成功与否的问题,从哪里开始
我们有一个基于网络的生产产品,允许用户对商品的未来价值(或需求)进行预测,历史数据包含大约 100k 个示例,每个示例大约有 5 个参数;
考虑一类称为预测的数据:
以及衡量预测结果的配对结果类:
我们可以定义一个成功的测试用例,其中在预测时考虑方向和值时,如果任何两个未来值检查点是有利的。
在用户提交表单的那一刻,预测类中的所有内容都是已知的,而预测结果中的信息直到后来才知道;理想情况下,模型或算法可以从我们将算法应用于新预测的三年历史中推导出来,我们可以获得关于它是否会成功的概率(我会很高兴有一个布尔 Y/N 标志不管这是否有趣)。
我对机器学习知之甚少,我正在尝试通过材料来解决问题。但是,如果我能得到一些指导,那就太好了,这样我就可以研究和实践解决此类问题所需的确切方法。
谢谢
java - Java中一组点的简单形状识别
我在坐标系中有一组随机分布的点,我有兴趣识别某些点是否形成任何几何图形,如正方形、圆形、平行四边形或简单的线条。
是否存在任何用于识别模式的库或算法?或者也许一些提示如何编程这样的东西?
algorithm - 特定对象/图像识别任务的最佳方法?
我正在寻找照片中的某个物体:
对象:中间有 X 的矩形的轮廓。它看起来像一个矩形复选框。就这样。所以,没有填充,只有线条。矩形将具有相同的长宽比,但它可以是照片中的任意大小或任意旋转。
我看过一大堆图像识别方法。但我正在尝试确定最适合这项特定任务的方法。最重要的是,对象是由线条组成的,而不是填充的形状。此外,没有透视失真,因此矩形对象在照片中始终具有直角。
有任何想法吗?我希望我可以很容易地实现一些东西。
谢谢大家。
c++ - 用于模式识别/图像处理的 C 或 C++?
我即将参加一些模式识别课程。由于我没有 C 或 C++ 方面的先验知识,我的教授告诉我在课程之前学习其中的一个,并在课程中学习更多。
我应该选择哪一个?
我在编程方面的先验知识主要限于 C#,但也有一些 PHP、SQL 和 Prolog。
search - 视觉相似度算法(用于 CBIR)
我正在尝试构建图像之间的视觉相似性集合,即大小、角度、颜色、旋转不变,用于基于内容的图像检索。与平台完全不可知,但首选 .NET、Java 或 Python。但如果其他人可用,请。建议离开。
我对 OpenCV 匹配模板和匹配形状非常熟悉。我也看过 AForge.NET。
ps 类似于http://www.imgseek.net/home的东西是理想的:
path - 检测和存储路径组合以供以后分析目的的最佳方法
我正在寻找有关如何存储用户路径模式的想法/示例 - 目的是分析他们的行为并在我们能够以某种方式检测到它们时优化“最常用的路径”。
例如。他们在做什么之后执行哪个动作,以便我们稍后可以检查某些动作是否一遍又一遍地完成 - 因此开发一个快捷方式或将一些动作组合成一个组合的多动作。
我的第一个猜测是某种“简单日志”,可能以某种 SQL 方式存储,我们可以将每个操作作为索引保存,然后记录所有内容。
问题是路径/动作可能会动态改变——即使是在记录时——所以我们也需要能够处理这个事实,在以后寻找模式时。
您会先记录“大时代”的一切,然后在一段时间后对每一个细节进行 POST 处理,还是您对其他策略有丰富的经验?
我担心的是这会占用空间,在一个月或更长时间内每天记录 1000 个用户时会占用大量空间。
希望这是有道理的,我很想知道是否有人可以提供示例代码、伪代码或者可能是有用的链接。
我们的工具将是 C#、SQL 数据库、XML 和 .NET 3.5 - 如果需要,客户端也可以获得 .NET 4.0。
我们期望的模式示例
等等。没有真正的方法知道他们接下来要做什么,也不知道他们将使用多少,他们将多久做一次。
次要目标,如果可能的话,如果我们稍后添加一个名为 G 的新“动作”(仅举例说明,将有数百个动作),我们如何检测这些新行为对先前模式的影响。
为了更好地解释它,我的想法是用某种方法来检测“模式中的模式”,有点像压缩的工作原理,因此“重复模式”是有斑点的。我们不知道这些模式会持续多久,也不知道它们出现的频率。我们如何将其分解为“小块” - 您认为最好的方法是什么?
nlp - 同步文本和音频。是否有 NLP/语音到文本库来执行此操作?
我想将语音录音与已知文本同步。是否有可以促进这一点的语音到文本/自然语言处理库?我想我想检测单词边界并从字典中计算候选匹配。我在 SO 上发现的大多数问题都与书面语言有关。
需要但不是必需的:
- 开源
- 开箱即用地兼容美式英语
- 跨平台
- 详细记录
编辑:我意识到这是一个非常广泛,甚至是幼稚的问题,所以提前感谢您的指导。
到目前为止我发现了什么:
- OpenEars(iOS Sphinx/Flite 包装器)
fonts - 识别屏幕截图中字符的最佳方法?
你会推荐什么来识别屏幕截图中的所有字符?屏幕截图非常清晰(只有白色背景上的黑色文本),我也可以为文本选择任何标准字体(安装在 Windows 上)。我尝试了一些 OCR 方法(Tesseract 等),但它在识别某些字符时出错(这让我感到困惑,因为文本没有丝毫噪音,而且字体是一些最常见的字体 - Courier New、Fixedsys 等),我需要它是 100% 准确的。是否有一些库可用于此特定目的,一些模式识别或其他什么?或者我应该得到一些等宽字体的屏幕截图,并遍历图像,向右移动 +font_size 像素,然后将捕获的东西与字母的内存表示和相同大小的相同字体的数量进行比较?解决这个问题的最佳方法是什么?非常感谢您提前。
更新:我终于通过使用等宽字体(Courier New)以我正在截屏的确切大小训练 Tesseract 来获得 100% 的准确度。希望对将来的人有所帮助:)
image-processing - 如何确定直线的方向向量?
我有一个编程问题,在几何形状识别(矩形、椭圆等)的背景下。在这种情况下,如果我有一条简单的线,从 (x1,y1) 到 (x2,y2) - 由一系列点(xy 对)组成 -
我将如何计算这条线的 DIRECTION VECTOR?我了解它背后的数学原理,但我发现我的客户提供的算法有点含糊。我被困在这个算法的第 3 步)。以下是我的客户提供的算法(英文而不是 ot psedocode)。
1)将构成“笔划”或“线”的点制动成X组(默认情况下X = 20 - 我们将调整)点=一个PointSet
2) 对于每个 PointSet,找到第一个和最后一个 Y 点的 EndPouint(末端点的平均值)(默认情况下 Y = X/5)。
3)找到PointSet的DirectionVector=减去CentrePoints
4) 对于每对PointSets,找到AngleChange = PointSets 的DirectionVectors 之间的角度。
等等.......我试图弄清楚第(3)点是什么意思......任何帮助都会非常感谢人们!提前致谢。