python-2.7 - Python上的CAPTCHA识别算法

翻译自：https://stackoverflow.com/questions/42065636 2017-02-06T10:35:42.413

987 次

我正在尝试使用 Python、OpenCV 和 Tesseract 设计一种验证码识别算法。问题是验证码数字在图像中未对齐并随机聚集。Pytesseract 大部分时间都失败并返回空列表。数据看起来像：这应该返回 41332 这应该返回 35545

数字在一行中的相对平坦的 CAPTCHA 可以更好地检测到。我该如何解决这个问题？如何检测、裁剪和重新对齐此类图像中的数字，以使 tesseract（如果需要使用）更容易检测到它们？

0 回答 0