问题标签 [ocr]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
1136 浏览

c# - 从屏幕上读取字符

很长一段时间以来,我一直在努力寻找解决问题的方法。我需要构建一个程序,从屏幕上读取数据,识别字符和图像,然后根据字符和图像的内容采取行动。例如,我为它提供了一张狗的图片,每个可能的字符的图片,它可以读取屏幕并告诉我狗在哪里,字符在哪里以及以什么顺序等。在某个地方有一个免费的图书馆吗?我更喜欢可以在 C# 或 Vb.net 中使用的东西

0 投票
1 回答
2299 浏览

java - 适用于 Android 的 OCR 应用程序

我正在开发一个应用程序以在 Android 手机上对英文文本执行 OCR 的项目。

我希望使用现有的开源 OCR 引擎。例如,像 tesseract。

谁能帮帮我吗?指出我正确的方向?这是我的第一个项目。

0 投票
3 回答
795 浏览

image-processing - 在此分析的基础上对图像进行分析和转换以获得更好的 OCR 结果

我有一个 OCR 项目,但它只适用于文本相当笔直而不是颠倒的图像。(不旋转文本)所以我想让 OCR 能够识别任何类型的图像,即使是倒置的。但我不知道解决这个问题的方法是什么。

我需要分析字母行之类的东西,但即使那样我也无法确定行是否颠倒。

0 投票
1 回答
665 浏览

ocr - 为位图字体文件中的每个字形生成带标签的图像

是否有一种简单的方法可以为给定位图字体文件中包含的每个字形生成带标签的位图图像?

我正在尝试将一组日文 .bdf 字体转换为可在 MATLAB 和 C++ 中使用的格式,其中每个字形都用作它所代表的字符的 OCR 分类键。

0 投票
1 回答
318 浏览

perl - 我可以使用哪些其他诊断方法来解决这个特定的 Perl 问题?

经过大量实验,我仍然无法使以下脚本正常工作。我需要一些关于如何诊断这个特定 Perl 问题的指导。提前致谢。

此脚本用于测试 Office 2007 OCR API 的使用:

我做了一个小测试。我加载了一个包含 OCR 信息的 .MDI 文件。我删除了 OCR 方法行并运行了脚本,得到了预期的“print $OCRresult”文本输出。但除此之外,Perl 会向我抛出错误说

我怀疑线路有问题

我尝试将括号留空或使用三个参数,例如 'miLANG_ENGLISH',1,1 等,但没有任何运气。我还尝试使用 Microsfot Office Document Imaging 来测试我正在试验的 TIF 是否可识别文本并且结果是肯定的。

那么我还有哪些其他诊断方法?

或者碰巧有 Office 2007 的人可以使用包含文本内容的任何 jpg、bmp 或 tif 图片来测试我的代码,看看是否有问题?

提前致谢。

更新

哈哈,我终于弄清楚问题出在哪里以及如何解决了。@hobbs,感谢您留下评论 :) 事情很有趣。当我试图回复您的评论时,我添加了Office Document Imaging 2003 VBA 语言参考的 url 链接,我又看了一眼那里的东西。以下信息引起了我的注意:

我更改了以下 OCR 方法行:

对此:

几点注意事项: 1. 我在 Windows XP(中文版)上运行 ActivePerl 5.10.0 2. 在此之前,我已经尝试过 $miDoc->(9) 但没有运气

突然而神奇地,那个讨厌的错误说“在 E:\OCR-test.pl 第 15 行打印使用未初始化的值 $OCRresult”完全消失了,屏幕上出现了 OCRed 文本。OCR结果不满意,但参数“2052”指的是中文,TIF图像包含全英文。所以我将参数更改为 $miDoc->OCR(9,1,1) 但这次没有运气。Windows 向我抛出了这个错误:

我把TIF图片改成全中文的,参数改成“$miDoc->OCR(2052,1,1);” 又一次,这一次一切都像预期的那样工作。OCR 结果令人满意。

现在我认为我的 Office 2007 OCR API 有点奇怪,如果碰巧运行 Windows XP(英文版)并安装了 Office 2007 的人可能不会遇到带有参数的异常错误

无论如何,我真的很高兴我终于让事情正常了:D

0 投票
7 回答
100611 浏览

ocr - 限制字符 tesseract 正在寻找

是否可以限制tesseract正在寻找的字符集(例如仅搜索字母 az)?这将大大改善我的结果。

0 投票
1 回答
490 浏览

ocr - OCR 和文字审查

我正在将 Tesseract 用于我的字母识别项目,目前识别效果非常好。图像处理部分是使用 OpenCv 库完成的。这些字母是手写的。但是当我用它来识别字母“O”和数字“0”时出现了一些问题。这些字母在数据区域中用作输入名称的字段。所以名字不能有任何数字。当我们使用数据字段系统作为出生日期时,它只包含数字。所以我愿意限制识别系统,说相应的数据字段只有数字或字母。

而且我也愿意用可能的词来复习已识别的字母,这样我们就可以提高数据的准确性。我愿意为这项任务使用 openCv 库。但我不知道有哪些库可以帮助完成这项任务,以及它们的功能是什么。所以请有人可以帮助我。谢谢你。

问候,蒂兰卡。

0 投票
6 回答
7733 浏览

java - 检查 PDF 文件是否为扫描文件

以编程方式检查 PDF 文件是否为完全扫描文件的最佳方法是什么?我确实可以使用 iText 和 PDFBox。我可以检查一个 pdf 文件是否包含文本,并根据结果来决定这个文件是否是 OCRed,但这个解决方案并不是 100% 准确的。我想知道是否有另一种方法来解决这个问题。

如您所知,该解决方案必须基于 Java。

0 投票
3 回答
2669 浏览

java - any OCR techniques for java

I have MCA final year project to extract data from image (jpg, gif, etc.). I want to recognize data from image. I have used java ocr but it is not working. Are there any open source libraries which can help me?

0 投票
7 回答
4138 浏览

python - 通过 OCR 从 T 恤照片中提取代码

我最近看到有人穿着一件背面有一些 Perl 代码的 T 恤。我拍了一张照片并裁剪出代码:

替代文字

接下来,我尝试通过 OCR 从图像中提取代码,因此我安装了Tesseract OCR及其 Python 绑定pytesser

Pytesser 仅适用于 TIFF 图像,因此我在 Gimp 中转换了图像并输入了以下代码(Ubuntu 9.10):

这显然是来自 OCR 引擎的胡言乱语。所以,我的问题是:

  • 我该怎么做才能从 Tesseract 中获得更好的 OCR 结果?
  • 或者,其他人是否有更好的运气以另一种方式从上面的图像中提取代码?