0

我想将 tesseract-ocr 库与 python-3.4 一起使用。我用“sudo apt-get install tesseract-ocr”下载了 tesseract,现在我可以在命令行中使用它了。但我想将它与 python3 一起使用。但我找不到任何将本机 tesseract 与 python3x 一起使用的教程。

实际上我尝试使用像 pytesseract 这样的包装器。我从https://code.google.com/p/python-tesseract/wiki/Python3Tesseract下载并使用 dpkg 安装它。我试图导入它,但我得到一个奇怪的错误。

错误信息是;
“ImportError:/usr/lib/python3/dist-packages/_tesseract.cpython-34m-x86_64-linux-gnu.so:未定义符号:_Z11GetUTF8TextPN9tesseract11TessBaseAPIE”

我尝试了 python3x 的 tesserPy 包装器。它适用于土耳其语、英语,但不适用于阿拉伯语。(我只为这些语言测试了 tesserpy。)你可以从那个地址得到 tesserpy; https://github.com/blindsightcorp/tesserpy

这是我为阿拉伯语运行 tesserpy 时的错误消息;

tessdata_manager.SeekToStart(TESSDATA_INTTEMP):Error:Assert failed:in file adaptmatch.cpp, line 511

有没有人看到过这种错误信息?

提前致谢

4

1 回答 1

0

我今天编辑了我的问题,我告诉我可以用 tesserpy 为英语和土耳其语制作 ocr。tesserpy 很可能适用于所有语言。但我还是有问题。我无法为阿拉伯语脚本运行 tesserpy。于是我继续搜索,发现了pyocr。它也适用于阿拉伯语脚本。您可以从 git 轻松克隆和使用它;

PyOcr github 存储库

我希望这个问题可以指导某人。

于 2015-01-26T15:44:49.293 回答