我一直在尝试用 Python 实现一个 OCR 程序,它可以读取具有特定格式 XXX-XXX 的数字。我使用了 Google 的 Cloud Vision API Text Recognition,但结果不可靠。在 30 张高对比度 1280 x 1024 bmp 图像中,只有少数产生了正确的输出,或者至少在结果中包含了正确的输出。该程序倾向于省略一些数字,以非英语语言输出或潜入一些特殊字符。
目标是至少连续输出正确的数字,不管结果是否撒满了其他垃圾。有没有办法帮助程序更好地识别数字,例如将结果限制为特定格式或仅限数字?