问题标签 [tesseract]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
5 回答
56979 浏览

c# - 带有 Tesseract 界面的 OCR

你如何在 C# 中使用 Tesseract 的界面对 tiff 文件进行 OCR?
目前我只知道如何使用可执行文件来做到这一点。

0 投票
8 回答
43946 浏览

fonts - OCR 的理想字体是什么?

有人对 OCR 的不同字体有任何经验吗?我正在生成一个 ID,然后尝试使用 tesseract 对其进行扫描。目前我只是 T&E'n 不同的字体,但这似乎效率很低。我尝试过 OCR* 系列字体,以及其他各种字体,例如 Arial 和 Georgia。tesseract 容易与 OCR* 字体混淆。

是否有任何专为 tesseract 设计的字体,或任何适用于它的系统字体?

0 投票
3 回答
2407 浏览

java - 通过命令行调用与 JNI

我需要从 Java 应用程序服务器调用 tesseract OCR(它是 C++ 中的一个开源库,用于进行光学字符识别)。现在很容易使用 Runtime.exec() 运行可执行文件。基本逻辑是

  1. 将当前保存在内存中的图像保存到文件(.tif)
  2. 将图像文件名传递给 tesseract 命令行程序。
  3. 使用 FileReader 从 Java 读取输出文本文件。

通过为 Tesseract 编写 JNI 包装器,我可能会在性能方面获得多少改进?不幸的是,没有在 Linux 中工作的开源 JNI 包装器。我必须自己做,并且想知道收益是否值得开发成本。

0 投票
5 回答
4015 浏览

c++ - 如何将图片放大到 300 DPI?

C++ Library for image recognition: images contains words to string问题的公认答案建议您:

  1. 将输入图像放大/缩小到 300 DPI。

我将如何做到这一点...我的印象是 DPI 用于显示器,而不是图像格式。

0 投票
4 回答
1523 浏览

testing - 如何为 OCR 软件提供最大的成功机会?

我正在使用Tesseract OCR(通过pytesser)和 PIL(Python 图像库)对应用程序进行自动化测试。

我正在通过截屏并通过 tesseract 获取文本来检查显示的文本是否正常。

一开始我遇到了一些问题,但由于 PIL 的双三次插值,我增加了屏幕截图的大小,所以效果似乎更好。

不幸的是,我仍然有一些错误,例如混淆“0”和“O”。我可以想象我以后还会遇到其他类似的问题。

我想知道是否有一些技术可以准备图像以帮助 OCR。欢迎任何想法。

提前致谢

0 投票
2 回答
20519 浏览

android - 在安卓上使用 tesseract

我正在开发一个使用 tesseract OCR 引擎的 android 项目。过去几天我一直在互联网上搜索有关 tesseract 对 android 平台的任何支持。但我没有得到任何帮助...请帮助我了解我的工作方式将 tesseract 用于 android 平台...或者我如何在 android 上安装它..

任何形式的帮助都非常受欢迎......请提前帮助谢谢

0 投票
1 回答
288 浏览

c++ - 如何从 MagickWand 对象(在 C 中)获取 libtiff TIFF 对象?

如何从 MagickWand 对象(在 C 中)获取 libtiff TIFF 对象?

我想用 ImageMagick 打开任何给定的图像类型并在其上运行 tesseract。Tesseract 似乎使用 libtiff 作为它的 IO,ImageMagick 似乎使用 libtiff 作为它的 tiff 处理,所以我想我应该能够以某种方式将 ImageMagick 与 tesseract 一起使用,而无需干预文件系统和额外的不必要的磁盘 IO。

谢谢,陈兹

0 投票
2 回答
4894 浏览

php - 如何使用 PHP 安装和启动 tesseract-ocr

我正在寻找一个使用 php 将文本图像转换为字符的 OCR 组件。

我从google code得到了一个脚本 tesseract-ocr 。如何通过 php 安装和启动 tesseract-ocr?

由于我是 PHP 的初学者,我无法提供他们提供的文档。我需要一些简单的步骤来安装和启动?提前致谢。

0 投票
1 回答
2023 浏览

embedded - 在 ARM/Gumstix 上编译 tesseract-ocr?

是否可以为某些Gumstix板上的Intel PXA270编译tesseract-ocr ?有没有人成功地做到了这一点,如果有,你是怎么做到的?

0 投票
2 回答
3272 浏览

.net - 使用 Tessnet2 的 .NET 应用程序失败

我有一个使用Tessnet2的应用程序。当我尝试调用其 Init 方法时,应用程序失败。
失败太可怕了——没有例外(ANY),没有任何错误痕迹,甚至没有“发送报告”窗口。该应用程序的进程刚刚删除

有问题的代码是:

几个可能有用的注释:

  • Tessnet2 需要Visual C++ 2008 运行时。不确定它是否应该是 msvcm90.dll、msvcm80.dll。
  • 该应用程序是桌面 WPF。
  • 开发环境:VS 2008 SP、.NET 3.5 SP1
  • 它以前工作过(我想我添加了 Web 引用来使用 SOAP Web 服务,但我试图删除它但没有结果)。
  • 单元测试运行良好,没有失败

从这些观察来看,这听起来像是 WPF 应用程序本身的问题。

我只有一条信息是调试期间的输出:

应用程序失败时的最后一块:

更新:我检查了事件日志。没有任何带有“SideBySide”来源的条目。下面只有与该问题相关的条目,但不幸的是它并没有告诉我很多信息:

提前感谢您的任何提示。