java - 7段OCR java应用

Question

我已经在这个项目上工作了几个月，需要一些帮助。我正在尝试识别来自旧相机的图像上的字符，该相机使用七段 LED 将帧号印在图像的右下角。问题是这些图像是人的，并且肤色与一些肤色较浅的图像相混淆。但是大多数情况下通常不能被传统的 OCR 识别，我正在尝试使用 Tesseract，但在编译应用程序时未能成功，只是为了对其进行测试和训练。我在这里问是否有其他人有类似的问题或知道 Tesseract 的替代品能够识别这些字符。最好是可训练的 ocr。我的搜索结果为空。

示例图像

score 0 · Accepted Answer

大多数 OCR 都存在图像背景问题，因此您应该首先尝试隔离文本。由于这是计算机渲染的文本，因此：

文本很可能在图像中的同一位置

所以没必要去寻找。
文本很可能总是使用相同的字体

如果你拥有它，这将大大简化事情，甚至可以使用简单的方法，如每像素比较或相关系数，结果更好，然后是基于神经网络的分类。你也可以试试这个简单的 OCR。
您可以检测到文本的“确切”颜色，过滤掉所有其余部分

尝试检测文本是实心的还是透明的（添加/异或到图像像素）。无论如何，在此之后检测文本像素应该不会太难。一旦您可以可靠地检测到您的文本像素，就可以将其他所有内容涂黑，然后使用 OCR。

java - 7段OCR java应用

1 回答 1

Related

Reference