问题标签 [tess4j]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
4483 浏览

java - Windows 64 位上的 Tess4j:多线程异常

我在 Windows 64 位上使用带有 Java 8 的 tesseract 3 来 OCR 扫描的 PDF。我按照Tess4j 页面上的说明使用了所需 DLL 的 64 位版本,并安装了 64 位 Ghostscript。

当我使用正常的@Test(无参数)运行单元测试时,代码运行正确,所以我想我已经正确安装了所有东西。

当我用 2 个线程并行运行它时(见下文),我得到一个异常。

我在这里阅读了相关主题,但建议使用我正在使用的 Tesseract1(我都尝试过)。

有任何想法吗?

这是代码:

这是一个例外:

更新:似乎与有关。

0 投票
2 回答
3529 浏览

java - 如何在 Tess4J OCR 项目中指向 eng.traineddata

我是 Tess4J 的新手。我收到此错误

打开数据文件时出错 ./tessdata/eng.traineddata 请确保将 TESSDATA_PREFIX 环境变量设置为“tessdata”目录的父目录。加载语言 'eng' 失败 Tesseract 无法加载任何语言!空白页!!

搜索后,我添加了指向具有 eng.traineddata 文件的“C:\Program Files\Tesseract-OCR\tessdata”的环境变量 TESSDATA_PREFIX。

我怎样才能让它工作。请帮助,如果可能的话,一步一步来。

0 投票
3 回答
5439 浏览

java - 找不到指定的模块。使用 maven 的 Tess4j

嗨,我在使用 java 的 tess4j 库时遇到问题。我正在使用maven。

线程“main”中的异常 java.lang.UnsatisfiedLinkError:找不到指定的模块。

我确定路径中设置的文件存在,因为方法存在返回true。调试器在此指令中显示问题:

这是错误:

我的依赖

我的代码

}

提前致谢。

0 投票
1 回答
5259 浏览

java - java.lang.NoClassDefFoundError 在没有 Eclipse 的情况下使用 tess4j 发生

我将 tess4j 库用于我的 java 应用程序。我按照说明将 liblept168.dll 和 libtesseract302.dll 复制到我的项目根文件夹中。当我使用 Eclipse 运行我的应用程序时,它可以正常工作。但是当我将它导出为可运行的 jar 文件时,它给了我 java.lang.NoClassDefFoundError - UnsatisfiedLinkError: The specified module could not be found。但我敢肯定,那个程序会看到这个文件,因为在我添加这个文件之前它给了我其他错误,即找不到文件。我也曾经将此 dll 复制到我的 jar 存档中,但它没有帮助。我绝对确定,我也使用了正确的 jre。我只是无法理解有什么问题......

有任何想法吗?

UPD:我按照你说的编辑了我的清单文件,它是:

清单版本:1.0

Rsrc-Class-Path: ./ jsoup-1.7.3.jar json_simple-1.1.jar Filters.jar ja i_core.jar jna-4.1.0.jar tess4j.jar jai_codec.jar jxl.jar myjsocksj.j ar jai_imageio.jar

类路径:jai_imageio.jar tess4j.jar

Rsrc-Main-Class: com.slando.MainWindow

主类:org.eclipse.jdt.internal.jarinjarloader.JarRsrcLoader

然后有关于丢失dll文件的错误,我将它们复制到jar中。然后同样的错误开始发生。

堆栈跟踪:

多一个:

0 投票
1 回答
1961 浏览

java - 在 Linux 下运行 tess4j (tessreact java wrapper)

在 linux 服务器tesseract 3.0.2库上已正确安装:

尝试运行tess4j包装器时,出现此异常:

异常文件中提到的存在:

tess4j代码中引发异常的位置如下所示:

我不知道如何解决它,因为所有库版本都相同,它在 Windows 下完美运行。

0 投票
2 回答
2320 浏览

java - java.lang.NoSuchMethodError 的原因:com.sun.jna.Native.register(Ljava/lang/String;)V

我有一个 java 应用程序,我正在转向动态网络项目。

桌面应用程序工作正常,但在动态 Web 项目中我收到此错误:

库中的第 44 行TessAPI1

Native.register(WINDOWS ? LIB_NAME : LIB_NAME_NON_WIN);

这个错误的可能原因是什么?

0 投票
1 回答
13209 浏览

eclipse - Tess4j:java.lang.UnsatisfiedLinkError:无法加载库

我在我的 Eclipse 项目中使用 tess4j.jar。当我在Eclipse上运行它时,我的项目工作正常,但是当我尝试运行导出的可运行 .jar 文件时,它总是由于“java.lang.UnsatisfiedLinkError: Unable to load library 'libtesseract302'”错误而失败。

我试图用类似帖子的解决方案来修复它,但没有任何效果。

  1. 将“libtesseract302”和“liblept168.dll”文件定位到“dll”文件夹中,并将其添加为源文件夹。
  2. 我正在运行 java 32 位并确认 dll 也是 32 位 dll。

错误日志:

0 投票
1 回答
335 浏览

tesseract - 需要一种在运行时指定“Tess Data”文件夹的方法

我正在使用 'tess4j' api 从 .jpg 图像中获取文本。'TessData' 文件夹打包在 jar 文件中。我想包含自定义字体并创建自己的“TessData”文件夹,有没有办法在运行时提供“TessData”位置。

我使用了下面的方法,它没有从自定义位置获取 TessData。

TessAPI1.TessBaseAPIInit3(handle, "C:\1. tesseract folder\bodoni mt\TrainData", lang);

请让我知道我们是否可以这样做。

0 投票
1 回答
1372 浏览

ocr - 如何获得小字体的准确结果

我正在尝试使用 Tesseract 3.02 从应用程序中读取文本以进行验证(自动化测试)。如果字体很小(8 到 10),它总是给我不正确的结果。在将图像传递给 tesseract 之前,我遵循了下面提到的图像处理。1. 将图像转换为灰度。(图片格式 JPG) 2. 重新缩放的图片 3. 转换为 300 DPI 的图片

对图像进行预处理后,将其传递给 tesseract。我拥有的大多数应用程序图像的字体都很小。此外,我确保字体类型在训练数据中可用,但准确率仍然很低。

如果我遗漏了什么,谁能指导我。

0 投票
1 回答
3344 浏览

android - 如何在 android、eclipse 和 java 中使用 tesseract OCR

我正在制作一个想要使用 tesseract OCR 库的应用程序。但是 tesseract 是用 C++ 编写的。所以我不喜欢 tess4J。我阅读了如何在 eclipse 和 android 项目中使用它的教程。我关注了这个问题(包括 Tess4J 到一个 Java 项目作为 Eclipse 中的库),但编写的步骤对我没有帮助。请指导我如何在 android 应用程序和 eclipse 中使用 tesseract 库,并将 java 作为代码库。