0

我们正在使用 Tesseract 的 Java 库,称为 Tess4j 将 PDF 文件转换为文本。它适用于 Tiff 文件以及一页 PDF 文件。但是对于多页 PDF,它确实会生成输出文件,当涉及到最后一页时,控件似乎并没有回到调用 doOCR 调用的原始应用程序。它只是停留/挂在那里而不做任何事情。本地呼叫没有返回是否有问题。我不知道,

请尽快让我知道是否有解决此问题的方法。

问候
维什

4

1 回答 1

0

Tess4J 确实支持多页 PDF 和多页 TIFF。在单元测试用例中用您的 PDF 文件替换并试一试。

于 2011-07-16T02:15:16.037 回答