我在一个网站上执行 ocr,特别是在这两个图像上:
我对 OCR 相当陌生,我使用以下内容:
from PIL import Image
import pytesseract
my_image = '....png'
text = pytesseract.image_to_string(Image.open(my_image))
在第二张图片中,它可以识别除单个数字 3、4、5、6 之外的所有内容。
在第一张图片中,它也无法识别单个数字。
我通过调整图像大小、反转图像和使用阈值来预处理图像。
这是一种标准字体,所以我知道还有其他方法可以做到这一点,但在一定程度上它对我有用,所以我想在进入更高级的东西之前保持简单。