opencv - 如何区分 2 类：图像上的数字和“其他字母和噪声”？

Question

我开发了一种图像识别算法，可以帮助从现实世界中找到脏面板上的字符。实际上，图像是一个包含字母、数字和泥浆的汽车登记牌。

该算法必须将字符分为两类：字母字符和数字。是否可以训练 LBP 或 Haar 级联来区分这两个类，由于数字形状的变化，训练结果会稳定吗？

请您简要解释一下或推荐更好的方法吗？

score 0 · Accepted Answer

“算法必须将字符分为两类：字母字符和数字。” - 尽管从技术上讲，您忘记了泥土和背景，但您可以将它们添加到广泛的类别“其他”中。Haars 级联用于面部检测之类的东西，因为它们通常在面部具有特征的中间空间尺度上近似小波。您的问题是不同的。您需要首先了解您的问题结构，阅读文献，然后才尝试使用纯粹的学习算法的力量。这本书实际上谈到了人们开始首先考虑方法而不是分析问题，这并不总是一个好的主意。

从技术上讲，您首先需要在图像中找到比识别它更具挑战性的文本，因为当前 OCR 通常用作库而不是从头开始创建。要在图像中查找文本，我建议首先进行自适应阈值处理以创建二进制映射（1-前景是字母和数字，0 是背景），然后在前景上执行连接组件并结合 SWT（笔画宽度变换）http：/ /research.microsoft.com/pubs/149305/1509.pdf

opencv - 如何区分 2 类：图像上的数字和“其他字母和噪声”？

1 回答 1

Related

Reference