1

我正在运行 python 2.6.6 并想安装pytesseract包。解压安装后,我可以从命令行调用pytesseract。但是我想在 python 中运行 tesseract。我有以下代码(ocr.py):

try:
     import Image
except ImportError:
     from PIL import Image
import pytesseract
print(pytesseract.image_to_string(Image.open('test.png')))
print(pytesseract.image_to_string(Image.open('test-european.jpg'),lang='fra'))

当我通过 python ocr.py 运行代码时,我得到以下输出:

Traceback (most recent call last):
  File "ocr.py", line 6, in <module>
    print(pytesseract.image_to_string(Image.open('test.png')))
  File "/pytesseract-0.1.6/build/lib/pytesseract/pytesseract.py", line 164, in image_to_string
    raise TesseractError(status, errors)
pytesseract.TesseractError: (2, 'Usage: python tesseract.py [-l language] input_file')

test.png 和 test-european.jpg 在工作目录中。有人可以帮我运行这段代码吗?我尝试了以下方法:

  1. 将 tesseract_cmd 调整为“pytesseract”
  2. 安装了 tesseract-ocr

感谢任何帮助,因为我现在正试图解决这个问题几个小时。

4

1 回答 1

2

tesseract_cmd应该指向命令行程序tesseract,不是pytesseract

例如在 Ubuntu 上,您可以使用以下命令安装程序:

sudo apt install tesseract-ocr

然后将变量设置为 justtesseract/usr/bin/tesseract

于 2016-10-19T13:29:28.260 回答