pdf - tesseract ocr 多页 pdf 挂起

Question

我们正在使用 Tesseract 的 Java 库，称为 Tess4j 将 PDF 文件转换为文本。它适用于 Tiff 文件以及一页 PDF 文件。但是对于多页 PDF，它确实会生成输出文件，当涉及到最后一页时，控件似乎并没有回到调用 doOCR 调用的原始应用程序。它只是停留/挂在那里而不做任何事情。本地呼叫没有返回是否有问题。我不知道，

请尽快让我知道是否有解决此问题的方法。

问候
维什

score 0 · Accepted Answer

Tess4J 确实支持多页 PDF 和多页 TIFF。在单元测试用例中用您的 PDF 文件替换并试一试。

pdf - tesseract ocr 多页 pdf 挂起

1 回答 1

Related

Reference