我开发了一种图像识别算法,可以帮助从现实世界中找到脏面板上的字符。实际上,图像是一个包含字母、数字和泥浆的汽车登记牌。
该算法必须将字符分为两类:字母字符和数字。是否可以训练 LBP 或 Haar 级联来区分这两个类,由于数字形状的变化,训练结果会稳定吗?
请您简要解释一下或推荐更好的方法吗?
我开发了一种图像识别算法,可以帮助从现实世界中找到脏面板上的字符。实际上,图像是一个包含字母、数字和泥浆的汽车登记牌。
该算法必须将字符分为两类:字母字符和数字。是否可以训练 LBP 或 Haar 级联来区分这两个类,由于数字形状的变化,训练结果会稳定吗?
请您简要解释一下或推荐更好的方法吗?
“算法必须将字符分为两类:字母字符和数字。” - 尽管从技术上讲,您忘记了泥土和背景,但您可以将它们添加到广泛的类别“其他”中。Haars 级联用于面部检测之类的东西,因为它们通常在面部具有特征的中间空间尺度上近似小波。您的问题是不同的。您需要首先了解您的问题结构,阅读文献,然后才尝试使用纯粹的学习算法的力量。这本书实际上谈到了人们开始首先考虑方法而不是分析问题,这并不总是一个好的主意。
从技术上讲,您首先需要在图像中找到比识别它更具挑战性的文本,因为当前 OCR 通常用作库而不是从头开始创建。要在图像中查找文本,我建议首先进行自适应阈值处理以创建二进制映射(1-前景是字母和数字,0 是背景),然后在前景上执行连接组件并结合 SWT(笔画宽度变换)http:/ /research.microsoft.com/pubs/149305/1509.pdf