我一直在实现一个 Android OCR 工具,它只使用 tesseract 来 ocr 数字。到目前为止,它使用普通数字字体提供了相当高的准确性。然而,当涉及到 7 段数字(在 LCD 上发现的数字)时,精度很差。
我尝试裁剪我的图像,使用 0 到 9 的白名单以及一些图像处理无济于事。关于如何提高准确性的任何想法?或者也许一些关于为 tesseract 训练特定 7 段数字的技巧肯定会对我有很大帮助。
提前致谢。
您可以在以下位置找到 7 个段的训练数据:
https://github.com/arturaugusto/display_ocr/tree/master/letsgodigital
在同一存储库中还有一个示例 python 代码。