android - Android Tesseract (Tess-two) OCR 七段效果不佳

Question

我正在开发一个应用程序，您可以在其中为设备拍照并存储信息。然而，由于该设备使用七段显示器/LCD，我很难获得好的结果。

我使用过 Firebase OCR、Google Vision ML Kit 和 Tesseract (Tess-two)。

它们中的每一个都提供了糟糕的结果，特别是考虑到我已经训练和微调它以识别 3 种类型的七段字体到 0.09 错误率的 Tesseract。

我也尝试过使用其他人的训练数据，例如letsgodigital

我已将图像转换为灰度然后将其二值化，我也仅将数字列入白名单，但仍无法正确检测到文本。我还能做些什么来改善结果？

下面的结果都是正方体。

score 0 · Accepted Answer

Tesseract 擅长识别文档。您提供的示例包含非常不相关的信息，例如机器和令人不安的徽标。

进行文本本地化以将七段内容分离出来是一种更好的预处理方法。

1 回答 1