android - Android Tesseract OCR 7 段数字

Question

我一直在实现一个 Android OCR 工具，它只使用 tesseract 来 ocr 数字。到目前为止，它使用普通数字字体提供了相当高的准确性。然而，当涉及到 7 段数字（在 LCD 上发现的数字）时，精度很差。

我尝试裁剪我的图像，使用 0 到 9 的白名单以及一些图像处理无济于事。关于如何提高准确性的任何想法？或者也许一些关于为 tesseract 训练特定 7 段数字的技巧肯定会对我有很大帮助。

提前致谢。

score 2 · Accepted Answer

您可以在以下位置找到 7 个段的训练数据：

在同一存储库中还有一个示例 python 代码。

1 回答 1