3

我正在使用tess4j作为来自JAVA的tesseract的包装器对图像运行一系列OCR。ocr 的过程仍然需要大量时间(有时甚至 5 秒),我正在努力加快速度。

我正在对图像进行自己的预处理和二值化,tesseract 没有必要进行 otsu 二值化。

我已经阅读了允许跳过图形处理部分的 IOS 教程,但我无法使用 tess4j 找到任何内容。

这里的 turial:https ://github.com/gali8/Tesseract-OCR-iOS/wiki/Tips-for-Improving-OCR-Results -
“...如果您已经执行了自己的预处理/阈值 [ ...]您可能想要绕过内部 Tesseract 阈值步骤。”

有人知道我如何以跳过 otsu 二值化的方式使用tess4j (来自 JAVA)吗?

4

1 回答 1

1

检查tesseract-ocr 参数列表以获取任何适用的设置。但是我读到,如果您发送二值化图像,Tesseract 将跳过图像上的阈值(source)。

于 2015-10-21T03:35:06.240 回答