我正在使用 Tesseract(一个 OCR 库)构建一个 iOS 应用程序(拍照并在其上运行 OCR),它可以很好地处理书写良好的数字和字符(使用常用字体)。
我遇到的问题是,如果我在 7 段显示器上尝试它,它会产生非常非常糟糕的结果。
所以我的问题是:有谁知道我该如何解决这个问题?Tesseract 有没有办法识别这些字符?
我正在使用 Tesseract(一个 OCR 库)构建一个 iOS 应用程序(拍照并在其上运行 OCR),它可以很好地处理书写良好的数字和字符(使用常用字体)。
我遇到的问题是,如果我在 7 段显示器上尝试它,它会产生非常非常糟糕的结果。
所以我的问题是:有谁知道我该如何解决这个问题?Tesseract 有没有办法识别这些字符?
我也很难让 tesseract 从 LCD 显示器的图像中识别数字。
我通过使用 ImageMagick 预处理图像以在其自身上叠加图像的副本并略微垂直移动以填充片段之间的间隙,从而获得了一些微不足道的成功:
$ composite -compose Multiply -geometry +0+3 foo.tif foo.tif foo2.png
不过,最后,我的可取之处是“七段光学字符识别”二进制文件:http ://www.unix-ag.uni-kl.de/~auerswal/ssocr/
非常感谢作者 Erik Auerswald 的代码!
我没有尝试过OCRing 7-Segment Display,但我怀疑这个问题可能是由于字符不是连接组件引起的。根据我的经验,Tesseract 不能很好地处理断开的字体。
简单的腐蚀(图像预处理)可能有助于连接段,但您必须对其进行测试并使用内核大小来防止过多的失真。