问题标签 [text-recognition]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
3 回答
44257 浏览

c++ - C/C++/Objective-C 文本识别库

有人知道 C/C++/Objective-C 中的任何免费/开源文本识别库吗?基本上可以扫描图像并读出所有纯文本的东西。

0 投票
1 回答
2043 浏览

image-processing - 提高扫描文档的 OCR 准确性

我正在使用标准的 Brother A3 Multifunction 扫描大量 A3 文档,然后使用 FineReader Pro 对图像进行 OCR 处理。

但是,我在识别的字符中有很多错误,还有很多非字母数字的奇怪字符。

有人可以给我任何关于以编程方式提高 OCR 准确性的提示,无论是对扫描图像进行预处理,还是对识别的文本进行后处理?


编辑:查找示例 pdf。它包括一些样本图像,我从中得到最差的结果。

0 投票
2 回答
5237 浏览

iphone - 是否有任何将图像转换为文本格式的 iphone 类?

我想开发一个 iPhone 应用程序,它将某种图像转换为文本格式。我想知道是否有任何内置库可以实现此目的?

0 投票
3 回答
10729 浏览

delphi - 在delphi中识别图片中的文本

我需要关于如何解决这个问题的建议。我有一些图片数据:*.jpg、*.bmp ... 我需要从中提取数据。数据是字母数字文本。我在德尔福工作。

0 投票
4 回答
37074 浏览

c# - 使用哪个库从图像中提取文本?

我正在编写一个程序,当给出一个低级数学问题的图像(例如 98*13)时,它应该能够输出答案。数字是黑色的,背景是白色的。不是验证码,只是一个数学问题的图像。

数学题只有两个数字和一个运算符,而那个运算符只有 +、-、* 或 /。

显然,我知道如何进行计算;)我只是不确定如何从图像中获取文本。

一个免费的库将是理想的......虽然如果我必须自己编写代码,我可能会管理。

0 投票
3 回答
686 浏览

c# - 识别字符串中的日期

我想要一个像这样的课程:

日期可能存在于字符串中的任何位置,并且可能是任何格式。目前,我可以仅限于美国文化格式。日期不会以任何方式分隔。它们可能在日期的各个部分之间有任意数量的空格。我的想法是:

  • ANTLR
  • 正则表达式
  • 手卷

我从未使用过 ANTLR,所以我将从头开始学习。我想知道是否有库或代码示例可以做类似的事情,可以让我开始。ANTLR 对于如此狭窄的用途来说是否太重了?

我以前使用过很多正则表达式,但我讨厌它,因为大多数人讨厌它。

我当然可以手动滚动它,但我宁愿不重新解决已解决的问题。

建议?

更新:这是一个例子。鉴于此输入:

这是 63 年 11 月 3 日的日期。这是另一个:1963 年 11 月 3 日;另一个是 63 年 11 月 3 日和更多(1963 年 11 月 3 日)。日期可以是任何美国格式。他们可能有像 11-2-1963 这样的破折号或像这样的奇怪的额外空白:1963 年 11 月 3 日,甚至可能像 [Nov 3 63] 那样缺少逗号,但这是一个边缘情况。

输出应该是一个包含七个日期时间的数组。每个日期都相同:11/03/1963 00:00:00。

更新:我完全用手卷了这个,我对结果很满意。我最终没有使用正则表达式,而是使用带有自定义 DateTimeFormatInfo 的 DateTime.TryParse,它允许您非常轻松地微调允许的格式以及处理 2 位数年份。考虑到这是异步处理的,性能是完全可以接受的。棘手的部分是以有效的方式标记和测试相邻标记集。

0 投票
2 回答
2480 浏览

java - 在 JPG 图像中查找文本的边界框

我的问题与类似,但范围更具体。

在我的纸牌游戏应用程序中,我希望用户能够单击扫描的 jpeg 图像中的单词。请参阅此口袋妖怪交易卡示例。

在这种情况下,用户应该能够将鼠标悬停在文本“Scratch”上,文本周围会出现一个脉动的矩形边框,表明它是可点击的。问题是如何检测文本的边界。将有一组用户可以点击的事先知道的单词(这些单词将逐张从数据库中检索)。继续我们的示例,本例中的数组将是 ["Scratch", "Live Coal"]。一旦用户点击“Scratch”,应用程序必须通过回调知道选择了“Scratch”而不是“Live Coal”。

我正在考虑使用光学字符识别库来解决这个问题,但是开源选项质量很差(例如 GOCR)和/或在多个平台(例如 Tesseract)上没有经过良好测试。我只关心 Windows 和 Mac 的兼容性。我是否缺少不需要 OCR 的明显/更简单的解决方案/算法?我不能简单地在每张卡片的边界框中手动编码,因为我的数据库中将有数千张扫描的卡片。用户还可以上传他自己的自定义卡片扫描,并附带一系列可点击的文本。

文本颜色并不总是黑色。查看允许的不同卡片和文本样式的全景图。黑卡有白色文字,倒数第三张卡(捷克罗姆)有黑色文字和白色轮廓。

任何编程语言的解决方案都值得赞赏。但是,请注意,我正在寻找开源算法和/或库。如果有 Ruby 或 Java 的解决方案,那就更好了,因为我的代码主要使用这两种语言。

编辑:我忘了提到数组中单词/短语的顺序与卡片上的顺序相同。因此,数组将是 ["Scratch", "Live Coal"] 而不是 ["Live Coal", "Scratch"]。我之所以提到这一点,是因为它可能会简化任务。因此,对于这个例子,我可以简单地寻找黑色像素(尽管我必须注意白色圆圈中的黑色星星)。但是,在攻击名称下方以较小字体显示描述性文本的情况会更加困难(同样,请参见全景图示例)。

0 投票
2 回答
1363 浏览

ocr - 是否有任何用于 c++ 构建器的 OCR SDK?

我想在我的应用程序中添加字符识别功能,这就是为什么要问你什么是最好的和负担得起的 OCR SDK 。我查看了 ABBY FineReader Engine 10.0,但还没有按照官方网站的要求获得试用版!

我已经下载了 Asprise OCR SDK,但它不能识别西里尔符号..

如何在我的应用程序上实现字符识别?通过使用什么样的库、SDK、API 等等。

0 投票
1 回答
488 浏览

php - 如何使用 PHP 从屏幕截图中获取字幕?

我从电影截图中获取字幕。一个例子 在此处输入图像描述

它会抢

嘿,为什么我们不都放松一下,嗯?

它与字幕无关。是截图。由于它是一个字幕,我们知道字体大小等是否会更容易抓取。

我知道你们中的大多数人会说 PHP OCR 库,但由于背景总是不同的,看起来它不起作用。

0 投票
3 回答
2505 浏览

image-processing - Mathematica 的 TextRecognize 达不到标准

请查看下面的屏幕截图,看看您能否告诉我为什么这不起作用。TextRecognize 参考页面上的示例看起来非常令人印象深刻,我认为识别这样的单个字母应该不是问题。我试过调整字母的大小以及锐化图像。

为了方便您自己尝试一下,我在这篇文章的底部包含了我使用的图像。您还可以通过在 Google 图片搜索中搜索“Wordfeud”来找到更多类似的内容。

数学截图

争吵板