我正在开发一个项目,该项目需要为具有丰富背景的图像提供准确的 OCR 结果。所以我正在比较两个 OCR(其中一个是 Tesseract)的结果来做出我的选择。关键是结果受到预处理步骤的强烈影响,尤其是图像二值化。我提取了另一个 OCR 的二值化图像并将其传递给 Tesseract,从而将 Tesseract 的结果提高了 30-40%。
我有两个问题,你的回答对我有很大帮助:
- tesseract 使用什么二值化算法,它是否可配置?
- 有没有办法提取 Tesseract OCR 的二值化图像,以便我可以用它测试另一个 OCR?
提前致谢 :)