7

我试图将 pytesseract 用于 OCR(从图像中提取文本)。我已经使用以下命令成功安装了 pytessearct -

pip install pytessearct

当我尝试再次安装它时,它清楚地表明 -

Requirement already satisfied (use --upgrade to upgrade): 
pytesseract in ./site-packages

这意味着 pytessearct 安装成功。当我尝试使用 - 在我的 iPython 笔记本中导入这个包时 -

import pytessearct

它抛出一个错误 -

ImportError: No module named pytesseract

为什么会这样?

4

1 回答 1

8

要使用 Python-tesseract - 需要 python 2.5+ 或 python 3.x - 首先你必须通过 pip 安装 PIL 和 pytesseract 包:

pip install Pillow
pip install pytesseract

然后你必须下载并安装 tesseract OCR:

https://sourceforge.net/projects/tesseract-ocr-alt/?source=typ_redirect

据我所知,它会自动将其添加到您的 PATH 变量中。

然后像这样使用它:

import pytesseract
from PIL import Image

img = Image.open('Capture.PNG')
pytesseract.pytesseract.tesseract_cmd = 'C:\\Program Files (x86)\\Tesseract-OCR\\tesseract.exe'
print( pytesseract.image_to_string(img) )

我希望它有帮助:)

于 2017-08-11T10:13:33.593 回答