问题标签 [text-recognition]

问问题

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

271 问题

0 投票

1 回答

13023 浏览

android - 谷歌移动视觉文本 API 示例

我目前正在编写代码，该代码应该能够查看文本图片，然后从图片中为基于 android 的设备提取文本。我在网上做了一些研究，发现谷歌提供了他们自己的名为“Mobile Vision”的 API（一个包含许多项目的包，即文本识别、面部识别等）。然而，在他们的演示中，他们只演示了实时文本识别。我想知道是否有人可以给我一个使用 Mobile Vision API 对静止图像进行文本识别的示例。欢迎任何帮助。谢谢。

2016-07-07T20:05:02.553

0 投票

1 回答

857 浏览

c# - 如何使用 Tesseract 提高结果识别率？

我正在使用图片

我想从中识别数字

结果很糟糕31 3 963 如何改善？

c#ocr tesseract text-recognition

2016-07-20T07:05:36.033

0 投票

1 回答

1009 浏览

android - 仅针对数字的文本检测

我希望新的移动视觉文本识别 API 仅扫描数字或字母。API 目前是否允许这样做？现在我做了很多后期处理来清理像“b”真的是“6”这样的错误，或者

如果现在没有，将来是否有 API 计划？

android google-vision text-recognition

2016-08-10T00:57:07.707

0 投票

2 回答

5491 浏览

python - Google Cloud Vision - 数字和数字 OCR

我一直在尝试用 Python 实现一个 OCR 程序，它可以读取具有特定格式 XXX-XXX 的数字。我使用了 Google 的 Cloud Vision API Text Recognition，但结果不可靠。在 30 张高对比度 1280 x 1024 bmp 图像中，只有少数产生了正确的输出，或者至少在结果中包含了正确的输出。该程序倾向于省略一些数字，以非英语语言输出或潜入一些特殊字符。

目标是至少连续输出正确的数字，不管结果是否撒满了其他垃圾。有没有办法帮助程序更好地识别数字，例如将结果限制为特定格式或仅限数字？

python ocr google-cloud-platform google-cloud-vision text-recognition

2016-09-16T22:06:03.330

0 投票

1 回答

129 浏览

signals - 文本检测前基于傅里叶变换的图像压缩

1x8 数据的 DCT [8,16,24,32,40,48,56,64] --(dct8)--> [100,-52,0,-5,0,-2,0,0.4]。现在，如果我们截断（即丢弃低频分量），然后在 1x8 间隔内将该 1x4 数据的逆 DCT 取为：[100,-52,0,-5] --(idct8)--> [8,15, 24,32,40,48,57,63]。即我们几乎得到相同的数据。

这可以通过应用 2D DCT 来减小 jpeg 图像的大小，然后丢弃低频值（因为大部分信号的能量位于@high 频率）即丢弃右下象限，然后是 2D IDCT？

PS：我必须处理“文本识别”，所以有损压缩不会影响我的性能，它可能会快得多。

signals jpeg image-compression dct text-recognition

2016-10-27T06:02:58.380

0 投票

1 回答

335 浏览

android - Android中的文本识别

我想自动化 Whatsapp 消息发送过程（Android）。为此，一旦从隐式意图触发 Whatsapp 以识别我要向其发送该消息的特定组名，我想使用文本识别功能。

我的问题是：

有可能按照我的想法去做吗？
什么可以用来做文本/图像检测？
一旦隐式意图被触发，哪个应用程序控制特定的弹出活动？控制转移过程是如何发生的？

android whatsapp text-recognition

2016-11-02T12:08:51.690

0 投票

1 回答

732 浏览

android - 文本识别 OCR Android：启动 Activity 时出错

我需要使用谷歌的文本识别 API 来使用相机识别文本。我下载了代码，它运行良好。但是我正在开发一个需要识别某个单词的项目，该单词保存在全局变量中。识别出单词后，我无法开始另一项活动。这是使文本识别的代码部分：

当我尝试开始另一个活动时，我收到以下错误：

我实际上不需要开始另一个活动，我需要将文本识别与某个单词进行比较。

此外，当我尝试获取全局变量的值时，出现以下错误：

我真的不知道如何解决它，我很感激任何帮助。谢谢

android android-activity text google-api text-recognition

2016-11-03T15:32:41.930

0 投票

1 回答

62 浏览

matlab - 获取每个检测到的字母的单独图像

我已经编写了这个 matlab 代码（如下所示）来检测图像中的文本。此代码正在检测图像中的文本，但现在我想为图像中检测到的每个字母创建一个输出图像。请告诉我该怎么做？

代码：

matlab image-processing image-segmentation text-recognition

2016-11-21T06:21:13.210

0 投票

0 回答

3340 浏览

android - Google Vision api 从位图中提取文本

我正在尝试开发一个从屏幕截图中提取文本的应用程序，并使用这些数据（数字和文本）做一些事情。它有效，但不像我预期的那样，它根本不准确。奇怪的是，我的应用程序和google vision api 网站上的“try api”以不同的方式识别相同分辨率的相同屏幕截图

例如：我的应用程序将带有“410”作为文本的屏幕截图识别为“A10”。否则 google api 站点正确识别 410

我注意到 google Keep OCR 比我的应用更好，它使用相同的 api？作为 google Keep 或 google vison api 站点，我可以做些什么来改善我的应用程序中的文本识别？

这是我的代码：

ocr类

安卓清单

摇篮

android ocr google-vision text-recognition google-keep

2016-12-01T22:24:21.210

0 投票

2 回答

5243 浏览

node.js - Tesseract - 如何从输入坐标的图像中提取文本？

我需要输入图像和坐标。输入坐标中的文本必须作为输出读取。如何使用 node-tesseract 做到这一点？

node.js ocr tesseract image-recognition text-recognition

2016-12-19T03:52:00.810

1 2 3 4 5 6 7 8 9 10

问题标签 [text-recognition]

Reference