0

我正在开发一个应用程序,您可以在其中为设备拍照并存储信息。然而,由于该设备使用七段显示器/LCD,我很难获得好的结果。

我使用过 Firebase OCR、Google Vision ML Kit 和 Tesseract (Tess-two)。

它们中的每一个都提供了糟糕的结果,特别是考虑到我已经训练和微调它以识别 3 种类型的七段字体到 0.09 错误率的 Tesseract。

我也尝试过使用其他人的训练数据,例如letsgodigital

我已将图像转换为灰度然后将其二值化,我也仅将数字列入白名单,但仍无法正确检测到文本。我还能做些什么来改善结果?

下面的结果都是正方体。

正方体结果不佳在此处输入图像描述

4

1 回答 1

0

Tesseract 擅长识别文档。您提供的示例包含非常不相关的信息,例如机器和令人不安的徽标。

进行文本本地化以将七段内容分离出来是一种更好的预处理方法。

于 2021-02-13T19:12:40.223 回答