问题标签 [tess4j]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
0 回答
875 浏览

java - Tess4j jar 文件问题

对于这个程序,我已经把 jar 文件tess4j-1.5.0jai_imageio-1.1. 但它仍然显示error

谁能告诉我为解决错误需要采取哪些必要措施?我从堆栈溢出本身中获取了这个程序。谢谢!提前。

0 投票
1 回答
343 浏览

java - 用于具有复杂背景的图像的 Java OCR

我正在尝试从如下所示的图像中获取一些文本:
img OCR 示例

这个例子实际上是最好的情况,因为它们中的大多数将有一个彩色的和更复杂的背景。
我不需要它是 100% 准确的,因为我知道可能的结果并且可以尝试与它们进行部分匹配。

我试过 Aspose OCR 和 Tess4j。Aspose 给了我随机字符,而 Tess4j 什么也没给。

这可以通过免费图书馆实现吗?

0 投票
0 回答
694 浏览

ocr - java.lang.UnsatisfiedLinkError:无法加载库“libtesseract302”:找不到指定的模块

这是一种重复的问题,但没有一个答案有助于解决这个问题。我这样做了,

  1. 从这里提取代码
  2. 在VM参数中添加了-Djna.library.path=${workspace_loc:/ocr-tess4j-example}/dlls/x64,该文件夹包含三个dll文件gsdll64.dll、liblept168.dll和libtesseract302.dll
  3. 执行 java 文件“TesseractExample.java”

低于异常。

Exception in thread "main" java.lang.UnsatisfiedLinkError: Unable to load library 'libtesseract302': The specified module could not be found.

我尝试了以下选项,但没有任何效果

  1. 在 VM 变量中设置 jna.library.path
  2. 在 System.setProperty 中设置它
  3. 将这些 dll 文件保存在根文件夹中,并且不设置 jna.library.path

请帮我解决这个问题

0 投票
1 回答
141 浏览

ocr - 使用“数字”标志时 Tesseract 的意外结果

我的形象是目标图像,当我这样做时

我得到的结果是80 1 3047490虽然我希望只得到数字,即我的图像中的4749。我做错了什么?我的 Tesseract 版本是 3.03。

PS:我也试过没有成功tesseract myimage.png result nobatch digits

0 投票
2 回答
3971 浏览

java - JAVA Tess4j doOCR() 不工作,异常“无效的内存访问”

我在 Eclipse 中的动态 Web 项目中工作,我制作了一个 TesseractOCR 类,其中包含:

虽然有一个包含函数 doPost() 的 servlet

我有一个例外:

它失败了:

0 投票
1 回答
1346 浏览

java - Tess4j Java Tesseract 识别特定字体?

目前,我正在使用 Tess4j 识别图像中的文本。它准确地读取了我扔给它的 95% 的字符,但我想得到 100%。我知道图像使用的字体,我想知道是否有办法让 Tess4j 学习我正在寻找的字体。

提前致谢!

0 投票
1 回答
2442 浏览

java - NoSuchFieldError:将 Tess4J 与 Eclipse 一起使用时的 RESOURCE_PREFIX

我曾尝试在 Eclipse 中使用 Tess4J,但它导致标题中出现错误。我导入了这些 jar 文件:tess4j、jai_imageio 和 jna。我编写的测试代码是按照他们的示例页面上给出的示例。

完整的错误如下:

我怎样才能解决这个问题?

0 投票
1 回答
91 浏览

java - 如何让 tess4j 在 Netbeans 中编译

所以我试图从以下网站 http://tess4j.sourceforge.net/tutorial/获取简单的 ocr 测试示例

正确编译和读取 .tif 图像。但是无论出于何种原因,我在运行时都会遇到一堆错误。我有确切的文件夹结构,它是如何设置并按照说明进行的,在 stackoverflow 中研究了这个问题,并从 Microsoft Visual c++ 2005,2008,20010,2012,20013 下载了所需的视觉重新分发包,但仍然不行。这是项目结构、代码和错误的图像

http://i59.tinypic.com/t87xp2.png

0 投票
1 回答
1954 浏览

java - 绕过 Tesseract 预处理

我正在使用tess4j作为来自JAVA的tesseract的包装器对图像运行一系列OCR。ocr 的过程仍然需要大量时间(有时甚至 5 秒),我正在努力加快速度。

我正在对图像进行自己的预处理和二值化,tesseract 没有必要进行 otsu 二值化。

我已经阅读了允许跳过图形处理部分的 IOS 教程,但我无法使用 tess4j 找到任何内容。

这里的 turial:https ://github.com/gali8/Tesseract-OCR-iOS/wiki/Tips-for-Improving-OCR-Results -
“...如果您已经执行了自己的预处理/阈值 [ ...]您可能想要绕过内部 Tesseract 阈值步骤。”

有人知道我如何以跳过 otsu 二值化的方式使用tess4j (来自 JAVA)吗?

0 投票
0 回答
2227 浏览

ocr - 未应用 Tesseract 用户模式

我想在这张图片上做 OCR。在此处输入图像描述 这是预定义的格式。即前五个将字符,然后接下来的四个将是数字,最后一个将是字符。

当我执行以下命令时

我得到输出为BDVPD474SQ

所以,我选择了用户模式。我创建了一个名为bazaar的文件(在目录/usr/share/tesseract-ocr/tessdata/configs中) (其内容如下)

我还在目录/usr/share/tesseract-ocr/tessdata中创建了一个名为eng.user-patterns的文件(其内容如下)

不过,我得到了相同的结果

我做错了什么?有没有人通过 Tess4j 做到这一点?