我们想要训练一种特定的字体和所有来自 AZ 的字母和所有从 0 到 9 的数字。每个有多少正样本和负样本可以完成这项工作?虽然这将是一项乏味的任务,但 tesseract 读取移动车辆的车牌并不是那么准确。还有其他建议来完成这项任务吗?
1 回答
我引用以下维基百科文章 - https://en.m.wikipedia.org/wiki/Automatic_number_plate_recognition
该软件需要七种主要算法来识别车牌:
1.车牌定位——负责查找和隔离图片上的车牌。
2.板的方向和尺寸——补偿板的歪斜并将尺寸调整到所需的尺寸。
3.Normalization——调整图像的亮度和对比度。
4.Character segmentation——找出车牌上的各个字符。
5.光学字符识别。
6.句法/几何分析——对照特定国家的规则检查字符和位置。
7. 对多个字段/图像的识别值进行平均,以产生更可靠或更自信的结果。特别是因为任何单个图像都可能包含反射光耀斑、被部分遮挡或其他临时效果。
回到您的问题 Haar cascades 可用于定位车牌。但是对于 OCR 部分,我个人会推荐一个 CNN 网络。你可以在这里找到一个实现 - https://matthewearl.github.io/2016/05/06/cnn-anpr/
还有一个专门从事该任务的库- https://github.com/openalpr/openalpr也可以查看
对于 haar 级联 - https://github.com/opencv/opencv/blob/master/data/haarcascades/haarcascade_licence_plate_rus_16stages.xml
祝你好运