java - 绕过 Tesseract 预处理

Question

我正在使用tess4j作为来自JAVA的tesseract的包装器对图像运行一系列OCR。ocr 的过程仍然需要大量时间（有时甚至 5 秒），我正在努力加快速度。

我正在对图像进行自己的预处理和二值化，tesseract 没有必要进行 otsu 二值化。

我已经阅读了允许跳过图形处理部分的 IOS 教程，但我无法使用 tess4j 找到任何内容。

这里的 turial：https ://github.com/gali8/Tesseract-OCR-iOS/wiki/Tips-for-Improving-OCR-Results -
“...如果您已经执行了自己的预处理/阈值 [ ...]您可能想要绕过内部 Tesseract 阈值步骤。”

有人知道我如何以跳过 otsu 二值化的方式使用tess4j （来自 JAVA）吗？

score 1 · Accepted Answer

检查tesseract-ocr 参数列表以获取任何适用的设置。但是我读到，如果您发送二值化图像，Tesseract 将跳过图像上的阈值（source）。

1 回答 1