我正在尝试使用 Python、OpenCV 和 Tesseract 设计一种验证码识别算法。问题是验证码数字在图像中未对齐并随机聚集。Pytesseract 大部分时间都失败并返回空列表。数据看起来像: 这应该返回 41332 这应该返回 35545
数字在一行中的相对平坦的 CAPTCHA 可以更好地检测到。我该如何解决这个问题?如何检测、裁剪和重新对齐此类图像中的数字,以使 tesseract(如果需要使用)更容易检测到它们?
我正在尝试使用 Python、OpenCV 和 Tesseract 设计一种验证码识别算法。问题是验证码数字在图像中未对齐并随机聚集。Pytesseract 大部分时间都失败并返回空列表。数据看起来像: 这应该返回 41332 这应该返回 35545
数字在一行中的相对平坦的 CAPTCHA 可以更好地检测到。我该如何解决这个问题?如何检测、裁剪和重新对齐此类图像中的数字,以使 tesseract(如果需要使用)更容易检测到它们?