问题标签 [text-recognition]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
946 浏览

unity3d - 使用 Unity 进行文本识别

我正在努力使用文本识别。当我尝试它时,它会返回此错误,

在此处输入图像描述

即使我单击文本识别,它也不会显示文本识别行为(脚本)。怎么了 ?要使用文本识别,我使用的是 Unity 版本 2.0f3 并导入了 vuforia-unity-6-2-10.unitypackage。如果能详细解释,将不胜感激。

0 投票
2 回答
4664 浏览

r - 将图像转换为黑白以在 R 中进行图像识别

我正在尝试获得一些自动文本识别的经验,并且我正在使用包tesseract对一些图像(即我拍摄的一些屏幕截图)执行ocr 。

为了提高我的程序识别下图中价格的性能,我使用magick 包对图像进行了一些预处理,通过改变亮度和饱和度参数来增加图像的对比度。

但是,我认为通过转换为黑白图像可以进一步提高性能。

如何在R中有效地实现这一点?

原始图像 原始图像

预处理后 我预处理后的图像

0 投票
1 回答
533 浏览

c++ - OpenCV hmm 文本检测算法不适用于简单图像

我正在尝试编写简单的程序来识别一些简单的模式。它适用于 tesseract,但由于某种原因它不适用于Hmm. 这是示例代码:

和示例图像:

在此处输入图像描述

预期输出:uBuntu

实际输出:m

这段代码有什么问题?我只是尝试采用演示样本

这是使用的OCRHMM_transitions_table.xmlOCRHMM_knn_model_data.xml.gz(我实际上也从这个示例中获取了它们)。

OpenCV 版本 3.4.0

0 投票
1 回答
1525 浏览

android - 使用 Google 的文本识别 API 检测图像中的水平线而不是块

有没有办法使用谷歌的文本识别 API检测全尺寸的水平线(最大宽度)而不是图像中的文本块?比如说,如果我想从这样的收据图像中检索应付总额:

在此处输入图像描述

...因为到目前为止,API 会以任意顺序检测块中的文本,如下所示:

在此处输入图像描述

...不,TextBlockgetComponents()仅检索每个 TextBlock 中的行,因为 TextBlock 位于此处的文档中提到的文本层次结构的顶部(TextBlock 包含行) 。如果这个 API 可以从 Lines 而不是 TextBlocks 开始用于图像位图的框架......

我什至尝试使用硬编码坐标调整文本块的边界框(矩形)的大小,以希望检测到整行文本“Chicken Bowl ... 7.15”,但无济于事,如下所示:

0 投票
1 回答
1147 浏览

csv - 如何使用 Spacy 检测文本是人员、组织还是其他实体?

我有一个销售的 csv 记录,每条记录都有列客户名称。此列是人名和组织名称的组合。如何使用 spacy 来检测此列是个人还是组织?

0 投票
0 回答
55 浏览

ios - iOS - 有没有办法从用户的文本输入中检测流行的关键字并按流行度或趋势排序?

我正在构建一个允许用户输入 UITextInput 字段的应用程序。我希望能够扫描他们输入的内容并提取可能的关键字/短语,这些关键字/短语可用于填充应用程序中的其他内容,并按流行度/趋势对它们进行排序。

例子:

  1. 用户在输入中键入以下字符串:“我的兄弟姐妹太尴尬了,我等不及他们让我一个人呆着!
  2. 预期的关键字提取:“兄弟姐妹,尴尬,孤独,......
  3. 按流行度/趋势排序的预期关键字:“尴尬,兄弟姐妹,孤独,......

是否有用于此的 SDK 或原生 iOS 解决方案?

0 投票
1 回答
558 浏览

python - 如果我们知道语言,如何在检测图像上的文本时改进 Google Vision 结果

如何修改以下 Python 代码以返回德语结果?是否可以?谢谢你。

0 投票
2 回答
2469 浏览

android - 是否有任何 Android 应用程序可以检测屏幕上的特定文本并自动单击它?

我想要一个可以在我的屏幕上阅读文本并单击我可以在应用程序中预先定义的文本的应用程序。应用程序主要能够识别多个文本,如果其中任何一个出现在屏幕上,则单击该区域。

0 投票
0 回答
408 浏览

android - 是否可以使用 Google 的视觉 API 选择特定文本?

我正在设计一个应用程序,我使用相机扫描文本并使用该文本获取更多详细信息。为此,我正在使用 Google 的视觉 API。但默认情况下,API 会读取图像上可用的所有文本,如下所示。

在此处输入图像描述

从上图中您可以看到,该应用程序正在识别相机前可用的所有文本。但我想从相机中扫描“Hello World” 。是否可以使用某种触摸事件来专注于所需的文本

请找到用于文本识别的代码

0 投票
1 回答
2628 浏览

google-cloud-platform - Google Vision API 无法识别个位数

我有一个使用 Google Vision API DOCUMENT_TEXT_DETECTION 来从文档图像中提取文本的项目。

API 通常无法识别单个数字,如下图所示:

在此处输入图像描述

我想这个问题可能与一些去除噪声的算法有关,它将孤立的单个数字识别为噪声。有没有办法在这些情况下改善视力反应?(例如管理噪声阈值或其他参数)

在其他时候,Vision 将数字与字母混淆:

在此处输入图像描述

但是如果我指定参数 languageHints = 'en' 或 'mt' 这些数字会被 ocr 忽略。有没有办法强制识别数字或拉丁字符?