问题标签 [text-recognition]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
1437 浏览

android - Mobile Vision 无法仅检测数字

Android 上的 Mobile Vision 适用于许多字体足够大的文本。但是,当扫描一张满是打印数字的纸时(如下图所示),它什么也没有显示。

我知道这是一个文本识别器,所以尝试在这些大块数字周围添加几个词,然后繁荣,它奏效了。

有没有办法在没有单词要求的情况下启用它?

更新:偶然我放大了下面的照片并用 Mobile Vision 重新扫描,它工作了。我猜当字体大小增加时,算法将图像视为路标或车牌,因此执行了所需的操作。数字认了!

示例图像

0 投票
1 回答
1062 浏览

android - 无法使用 Mobile Vision API 从图像中读取文本

我正在开发一个移动应用程序,我试图从相机捕获的图像中提取仪表读数。

我做了研究,经过反复试验,最终决定使用 Google 的 Mobile Vision API 而不是tesseract-ocrOpenCV

因此,我使用 Mobile Vision API 下提供的 Text Recognition API 开发了一个小应用程序。这是代码。

一切正常,但无法从下图中的标记区域读取数字。

无法读取红色矩形中的数据区域

我试图将灰度图像传递给检测器,但没有成功。

请建议我如何使文本可读。

0 投票
2 回答
4778 浏览

ocr - 谷歌视觉ocr:竖横线条文本识别

我们正在使用 google vision ocr 从收据中收集文本。在某些情况下,收据上有一些垂直书写的文本,如增值税信息等。

问题是谷歌视觉只有效地读取主要方向的文本(例如水平方向),并丢弃在垂直方向而不是水平方向写在同一张收据中的所有文本。是否有设置参数来告诉谷歌视觉也获取垂直方向的文本?

我在网上放了一个带有两个方向文本的图像的示例。

https://drive.google.com/file/d/0B8kZz-q27lGGSUl5V3RjXzBLNnc/view?usp=sharing

从 g-vision 识别的文本: 水平文本行

我期望被识别的文本: 水平文本行 垂直文本行

0 投票
0 回答
367 浏览

java - OCR 文本识别摄像头未启动

我正在使用 android 中的 OCR 文本识别。我编写的代码完全没有错误,它也成功安装并创建了 APK,但我不知道问题出现在哪里,它停止了活动的启动。它甚至没有向我显示关于它为什么没有运行的任何错误,如果你有任何解决这个问题的方法,或者你是否可以在 android studio 上运行和测试它并找出错误。下面是我的代码和堆栈跟踪结果。谢谢你。

清单文件

堆栈跟踪

Gradle 依赖项

0 投票
1 回答
332 浏览

testcomplete - 如何滚动到测试完成中的特定坐标

我发现了一个记事本,记事本的文本框包含一个字符串,只有向下滚动才能看到该字符串。

现在我正在尝试通过将矩形坐标传递给测试完成来执行单击。因此,如果它在屏幕上可见,它就可以单击,否则它会失败说:“尝试执行在屏幕之外的某个点上的动作”

有什么方法可以让我们在执行操作之前滚动到交互点。

我尝试了以下步骤来实现这一点,但它没有帮助。

0 投票
1 回答
847 浏览

ios - 停止在 Apple Vision、iOS、Swift 中检测字母

我正在使用 Vision 检测文本,它工作正常我让它在检测到某些东西并调用函数时使用完成,但仍在检测到文本。

如何停止文本检测

要开始它,我正在使用:

0 投票
1 回答
55 浏览

pdf - 我想在我的计算机上识别所有 pdf 的文本并保存它们而不将它们从它们的位置移动。可能吗?

我尝试使用 Adob​​e Acrobat X Pro 来“识别多个文件中的文本”。

当我开始这个过程并询问目录时,我选择了 C:,我的主硬盘。

加载需要几个小时,当它加载时,它生成的文件列表也包括 word 文档。Adobe 说在我删除问题文件之前我无法继续。

一旦我删除了 Adob​​e 标记为有错误(如密码保护)的所有 pdf,并且提示仍然存在,我认为这意味着列表中的 word 文档。

所以我也手动删除了这些。但是 Adob​​e 仍然表示,在删除问题文件并且列表中没有任何剩余的文件被 adobe 标记为有问题之前,我无法继续。

我的公司正在努力确保我们拥有的所有 pdf 文件都是可搜索的。目前,有些是,有些不是。我们的目标是在不将它们从不同位置删除的情况下使它们都可搜索。

0 投票
0 回答
596 浏览

javascript - OCR,tesseract.js:如何将值与标签匹配?

我正在使用 tesseract.js 从 W2 表单中获取文本。我无法弄清楚如何将表单的值与标签匹配。就像我如何将标签“员工社会安全号码”与价值社会安全号码相匹配?

0 投票
2 回答
2028 浏览

java - TextRecognizer.isOperational() API 总是返回 false

这个问题已被多次提出,仅提出建议。希望我能理解每一个建议。

依赖项在清单中定义

并在应用程序级别添加

测试设备具有足够的存储空间,大于内部的 10%,并且具有非常好的互联网连接。权限也明确定义

我们启动 TextRecognizer 来检测文本,我们得到空响应:

大多数建议是使用较低的依赖性compile 'com.google.android.gms:play-services:7.8+',但它并不适用于所有人。发布应用后,部分用户无法使用该应用。

这些建议并没有解决问题。

类似的问题: TextRecognizer isOperational API 总是返回 falsedetector.isOperational() 在 android 上总是 false

0 投票
1 回答
98 浏览

ios - xcode/tesseract,使用照片库中的图像

我使用 tesseract 进行文本识别。我的问题是从照片库中获取照片,然后使用 tesseract。

我的代码:

在行中:

它说:

无法转换 UIImagePickerController 类型的值

我该如何解决?