3

各位晚安,

我正在尝试使用此处找到的 tesseract (OCR) python 包装器,第一个示例: https ://code.google.com/p/python-tesseract/wiki/CodeSnippets

我在 Windows XP 机器上使用 Python27。一切都是 32 位的。

我已经安装了本指南中的所有依赖项:http: //opencvpython.blogspot.com/2012/05/install-opencv-in-windows-for-python.html

我检查了环境变量: TESSDATA_PREFIX = C:\Program Files\Tesseract-OCR\tessdata\

最后,我尝试在 cmd.exe 中执行脚本:“python.exe 119.py”(119.py 是 CodeSnippets 中的第一个示例,具有不同的 c 图像),我收到以下错误:

C:\Python27>python.exe 119.py 打开数据文件时出错 C:\Program Files\Tesseract-OCR\tessdatatessdata/eng.traineddata 请确保将 TESSDATA_PREFIX 环境变量设置为“tessdata”的父目录目录。加载语言 'eng' 失败 Tesseract 无法加载任何语言!

现在,我在这里唯一注意到的是 eng.traineddata 之前的斜杠 (/) 而不是反斜杠 (\),这是在环境变量之后自动添加的位。我希望这是唯一需要修复的东西,但我不知道该怎么做,这就是我在这里的原因...... :)

所以,经验丰富的程序员,二进制之神,请帮助我。提前致谢。:)

ps

我需要为这个项目使用一台 Windows 机器,所以切换到 Linux 作为一种简单的方法在这里不是一个选择。:(

4

1 回答 1

0

我得到了同样的错误,在我通过 cmd 中的这个命令设置它之后,它接受了。

set TESSDATA_PREFIX=C:/Program Files (x86)/Tesseract-OCR/tessdata

即使 Windows 接受反斜杠,您也需要使用正斜杠。

于 2018-12-26T18:01:58.850 回答