各位晚安,
我正在尝试使用此处找到的 tesseract (OCR) python 包装器,第一个示例: https ://code.google.com/p/python-tesseract/wiki/CodeSnippets
我在 Windows XP 机器上使用 Python27。一切都是 32 位的。
我已经安装了本指南中的所有依赖项:http: //opencvpython.blogspot.com/2012/05/install-opencv-in-windows-for-python.html
我检查了环境变量: TESSDATA_PREFIX = C:\Program Files\Tesseract-OCR\tessdata\
最后,我尝试在 cmd.exe 中执行脚本:“python.exe 119.py”(119.py 是 CodeSnippets 中的第一个示例,具有不同的 c 图像),我收到以下错误:
C:\Python27>python.exe 119.py 打开数据文件时出错 C:\Program Files\Tesseract-OCR\tessdatatessdata/eng.traineddata 请确保将 TESSDATA_PREFIX 环境变量设置为“tessdata”的父目录目录。加载语言 'eng' 失败 Tesseract 无法加载任何语言!
现在,我在这里唯一注意到的是 eng.traineddata 之前的斜杠 (/) 而不是反斜杠 (\),这是在环境变量之后自动添加的位。我希望这是唯一需要修复的东西,但我不知道该怎么做,这就是我在这里的原因...... :)
所以,经验丰富的程序员,二进制之神,请帮助我。提前致谢。:)
ps
我需要为这个项目使用一台 Windows 机器,所以切换到 Linux 作为一种简单的方法在这里不是一个选择。:(