我正在编写一个脚本,该脚本获取图像并将图像裁剪为仅包含我希望它识别的数字。我的那部分工作正常。数字将是一位数或两位数。
我尝试使用 Google 的 Vision API,它运行良好并给出了正确的结果,但我宁愿在本地进行,以避免与使用该服务相关的费用。我目前正在使用 Tesseract OCR https://github.com/tesseract-ocr/tesseract
我希望它识别的图像示例:
Tesseract 是一个命令行程序,但我在一个 python 文件中调用它,该文件还处理我的脚本的其他部分。我不确定 Tesseract 是否是我想要的,或者是否有更好的解决方案来解决我的问题。
sudo tesseract imgName outputFile
无论我通过什么图像,我得到的唯一结果返回 0 并且还显示“空页面!!”
编辑:
我现在正在使用 pytesseract,我正在尝试使用以下代码:
print(pytesseract.image_to_string(img))
什么都没有输出,所以我尝试了
print(pytesseract.image_to_string(img,config ='--psm 6'))
它输出它猜测的随机字母。tesseract 有没有办法只查找数字,以便缩小我的结果范围?