我只测试了字母数字和数字的示例文本。我正在使用数字模式。
如何识别下图中的数字:
我认为是因为身高。我还尝试使用一些在线工具(不是代码)将其转换为 .jpg
我正在使用 pytesseract 0.1.6,但我认为这是 Tesseract 问题。
这是我的代码:
def classify(hash):
socket = urllib.urlopen(hash)
image = StringIO(socket.read())
socket.close()
image = Image.open(image)
number = image_to_string(image, config='digits')
mapping[hash] = number
return number
classify('any url')