我正在开发一个应用程序,您可以在其中为设备拍照并存储信息。然而,由于该设备使用七段显示器/LCD,我很难获得好的结果。
我使用过 Firebase OCR、Google Vision ML Kit 和 Tesseract (Tess-two)。
它们中的每一个都提供了糟糕的结果,特别是考虑到我已经训练和微调它以识别 3 种类型的七段字体到 0.09 错误率的 Tesseract。
我也尝试过使用其他人的训练数据,例如letsgodigital
我已将图像转换为灰度然后将其二值化,我也仅将数字列入白名单,但仍无法正确检测到文本。我还能做些什么来改善结果?
下面的结果都是正方体。