我正在尝试使用 teseract-OCR 对 python 中的图像文件进行 OCR。我的环境是-Windows 机器上的 Python 3.5 Anaconda。
这是代码:
from PIL import Image
from pytesseract import image_to_string
out = image_to_string(Image.open('sample.png'))
我得到的错误是:
File "Anaconda3\lib\sitepackages\pytesseract\pytesseract.py", line 167, in image_to_string
return f.read().strip()
File "Anaconda3\lib\encodings\cp1252.py", line 23 in decode
return codecs.charmap_decode(input, self.errors, decoding_table)[0]
UnicodeDecodeError:'charmap' codec can't decode byte 0x81 in position 1583: character maps to <undefined>
我已经尝试过这里提到的解决方案 黑客不起作用
我已经在 Mac OS 上尝试了我的代码,它正在运行。
我调查了 pytesseract 问题:这是一个未解决的问题
谢谢