2

我已经在这个项目上工作了几个月,需要一些帮助。我正在尝试识别来自旧相机的图像上的字符,该相机使用七段 LED 将帧号印在图像的右下角。问题是这些图像是人的,并且肤色与一些肤色较浅的图像相混淆。但是大多数情况下通常不能被传统的 OCR 识别,我正在尝试使用 Tesseract,但在编译应用程序时未能成功,只是为了对其进行测试和训练。我在这里问是否有其他人有类似的问题或知道 Tesseract 的替代品能够识别这些字符。最好是可训练的 ocr。我的搜索结果为空。

示例图像

4

1 回答 1

0

大多数 OCR 都存在图像背景问题,因此您应该首先尝试隔离文本。由于这是计算机渲染的文本,因此:

  1. 文本很可能在图像中的同一位置

    所以没必要去寻找。

  2. 文本很可能总是使用相同的字体

    如果你拥有它,这将大大简化事情,甚至可以使用简单的方法,如每像素比较或相关系数,结果更好,然后是基于神经网络的分类。你也可以试试这个简单的 OCR

  3. 您可以检测到文本的“确切”颜色,过滤掉所有其余部分

    尝试检测文本是实心的还是透明的(添加/异或到图像像素)。无论如何,在此之后检测文本像素应该不会太难。一旦您可以可靠地检测到您的文本像素,就可以将其他所有内容涂黑,然后使用 OCR。

于 2015-11-12T05:45:17.203 回答