问题标签 [text-recognition]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
13023 浏览

android - 谷歌移动视觉文本 API 示例

我目前正在编写代码,该代码应该能够查看文本图片,然后从图片中为基于 android 的设备提取文本。我在网上做了一些研究,发现谷歌提供了他们自己的名为“Mobile Vision”的 API(一个包含许多项目的包,即文本识别、面部识别等)。然而,在他们的演示中,他们只演示了实时文本识别。我想知道是否有人可以给我一个使用 Mobile Vision API 对静止图像进行文本识别的示例。欢迎任何帮助。谢谢。

0 投票
1 回答
857 浏览

c# - 如何使用 Tesseract 提高结果识别率?

我正在使用图片

在此处输入图像描述

我想从中识别数字

结果很糟糕31 3 963 如何改善?

0 投票
1 回答
1009 浏览

android - 仅针对数字的文本检测

我希望新的移动视觉文本识别 API 仅扫描数字或字母。API 目前是否允许这样做?现在我做了很多后期处理来清理像“b”真的是“6”这样的错误,或者

如果现在没有,将来是否有 API 计划?

0 投票
2 回答
5491 浏览

python - Google Cloud Vision - 数字和数字 OCR

我一直在尝试用 Python 实现一个 OCR 程序,它可以读取具有特定格式 XXX-XXX 的数字。我使用了 Google 的 Cloud Vision API Text Recognition,但结果不可靠。在 30 张高对比度 1280 x 1024 bmp 图像中,只有少数产生了正确的输出,或者至少在结果中包含了正确的输出。该程序倾向于省略一些数字,以非英语语言输出或潜入一些特殊字符。

目标是至少连续输出正确的数字,不管结果是否撒满了其他垃圾。有没有办法帮助程序更好地识别数字,例如将结果限制为特定格式或仅限数字?

0 投票
1 回答
129 浏览

signals - 文本检测前基于傅里叶变换的图像压缩

1x8 数据的 DCT [8,16,24,32,40,48,56,64] --(dct8)--> [100,-52,0,-5,0,-2,0,0.4]。现在,如果我们截断(即丢弃低频分量),然后在 1x8 间隔内将该 1x4 数据的逆 DCT 取为:[100,-52,0,-5] --(idct8)--> [8,15, 24,32,40,48,57,63]。即我们几乎得到相同的数据。

这可以通过应用 2D DCT 来减小 jpeg 图像的大小,然后丢弃低频值(因为大部分信号的能量位于@high 频率)即丢弃右下象限,然后是 2D IDCT?

PS:我必须处理“文本识别”,所以有损压缩不会影响我的性能,它可能会快得多。

0 投票
1 回答
335 浏览

android - Android中的文本识别

我想自动化 Whatsapp 消息发送过程(Android)。为此,一旦从隐式意图触发 Whatsapp 以识别我要向其发送该消息的特定组名,我想使用文本识别功能。

我的问题是:

  1. 有可能按照我的想法去做吗?
  2. 什么可以用来做文本/图像检测?
  3. 一旦隐式意图被触发,哪个应用程序控制特定的弹出活动?控制转移过程是如何发生的?
0 投票
1 回答
732 浏览

android - 文本识别 OCR Android:启动 Activity 时出错

我需要使用谷歌的文本识别 API 来使用相机识别文本。我下载了代码,它运行良好。但是我正在开发一个需要识别某个单词的项目,该单词保存在全局变量中。识别出单词后,我无法开始另一项活动。这是使文本识别的代码部分:

当我尝试开始另一个活动时,我收到以下错误:

我实际上不需要开始另一个活动,我需要将文本识别与某个单词进行比较。

此外,当我尝试获取全局变量的值时,出现以下错误:

我真的不知道如何解决它,我很感激任何帮助。谢谢

0 投票
1 回答
62 浏览

matlab - 获取每个检测到的字母的单独图像

我已经编写了这个 matlab 代码(如下所示)来检测图像中的文本。此代码正在检测图像中的文本,但现在我想为图像中检测到的每个字母创建一个输出图像。请告诉我该怎么做?

代码:

0 投票
0 回答
3340 浏览

android - Google Vision api 从位图中提取文本

我正在尝试开发一个从屏幕截图中提取文本的应用程序,并使用这些数据(数字和文本)做一些事情。它有效,但不像我预期的那样,它根本不准确。奇怪的是,我的应用程序和google vision api 网站上的“try api”以不同的方式识别相同分辨率的相同屏幕截图

例如:我的应用程序将带有“410”作为文本的屏幕截图识别为“A10”。否则 google api 站点正确识别 410

我注意到 google Keep OCR 比我的应用更好,它使用相同的 api?作为 google Keep 或 google vison api 站点,我可以做些什么来改善我的应用程序中的文本识别?

这是我的代码:

ocr类

安卓清单

摇篮

0 投票
2 回答
5243 浏览

node.js - Tesseract - 如何从输入坐标的图像中提取文本?

我需要输入图像和坐标。输入坐标中的文本必须作为输出读取。如何使用 node-tesseract 做到这一点?