问题标签 [python-tesseract]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
2468 浏览

python - 文件丢失或不兼容:ImportError:DLL 加载失败:%1 不是有效的 Win32 应用程序

问题:

尝试将python-tesseract导入我的项目(OCR 功能)时出现此错误:

ImportError: DLL load failed: %1 is not a valid Win32 application.

  • 我不知道到底是什么问题
  • 我没有技能和知识来追踪这类问题的根本原因。

背景:

据我了解,tesseract 是一个 32 位应用程序。我正在运行 Windows 7、64 位和 64 位 python。其他人似乎在这些条件下运行 tesseract,但他们并不理想,可能会导致这一挑战。

堆栈跟踪

这是来自 PyCharm 的错误跟踪。如您所见,它没有指定出现问题的文件,而是说它找不到看起来像字符串格式的参数:%1

依赖步行者

在似乎是问题的文件上运行依赖walker:_tesseract.pyd并发现了一些看起来很奇怪的事情:

  • 它找不到 Python27.dll
    • 尽管我已经成功使用 Python 很长时间了。
    • 我确认它Python.dll位于C:\Windows\System32我的系统上
  • 该文件MSVCR90.DLL是错误的 CPU 版本。
    • 它不在“预期”区域中,例如C:\Windows\System32,而是在我已安装的利基图形库的程序文件目录中:c:\program files\graphicsmagick-1.3.18-q8\MSVCR90.DLL. 两个安装会相互混淆吗?

截屏:

在此处输入图像描述

0 投票
8 回答
98070 浏览

python - 使用 python-tesseract 获取识别单词的边界框

我正在使用 python-tesseract 从图像中提取单词。这是一个 tesseract 的 Python 包装器,它是一个 OCR 代码。

我正在使用以下代码来获取单词:

这仅返回图像中的单词而不是它们的位置/大小/方向(或换句话说,包含它们的边界框)。我想知道是否有任何方法可以得到它

0 投票
1 回答
3208 浏览

python - image_to_string 在 Mac 中不起作用

我正在尝试在 Mac Maverick 中遵循这个 pytesser (链接)示例。

但是,在最后一行我收到此错误消息:

但是,我不明白我应该做什么。文件 phototest 在我运行脚本的同一个文件夹中。如何解决这个问题?

更新:

当我尝试

我收到此错误:

0 投票
1 回答
4909 浏览

python - Tesseract OCR:字体大小参数(单字符)

我想使用 Tesseract 识别具有典型字体的单个无噪声字符(例如 Times New Roman、Arial 等。没有奇怪的字体)。输入图像只包含字符,因此输入图像大小相当于字体大小。

我已经将页面分割模式设置为单字符,但结果仍然不理想,错误率约为 50%。

我认为如果我告诉 Tesseract 我的字体大小,我可以改进我的结果。有这样的参数吗?此外,如果存在,python-tesseract(Python 包装器)是否允许调整此参数?

0 投票
2 回答
36480 浏览

python - 如何在没有 sudo 的情况下为 Python 安装包时避免权限被拒绝

我正在尝试以tesseract用户身份安装 python 的包装器,mike以便我可以import tesseract。我在这里遵循指南https://code.google.com/p/python-tesseract/wiki/HowToCompilePythonTesseractForCentos

但是,当我执行python setup.py install

我收到以下错误:

我确实有 sudo 访问权限,但问题是:当我root以默认 python 版本登录时为 2.6,但是,当我以mike默认 python 版本登录时2.7(这是我想要的版本)。因此,如果我这样做sudo python setup.py install了,那么 for 的安装tesseract将发生在 on2.6而不是 on 上2.7

在这种情况下我能做什么?我应该更改site-packages文件夹的权限吗?我有点没有选择...

0 投票
2 回答
12840 浏览

python - 在 Mac OS X 上安装 tesseract/pytesser

我正在尝试为 osx 10.9(使用 anaconda 作为默认 python)安装这个(以及另外的 pytesser)。我在网上环顾四周,但我无法让任何教程工作,因为它们似乎都已经灭绝(例如,自制软件没有用于 leptonica 的公式)。在一周的大部分时间里,我可能一直在努力安装它,完全没有运气。

最近有没有人成功了——你是怎么做到的?

谢谢

编辑:奇怪的是,为 leptonica 酿造的啤酒已经迸发出来。我在下面有一个相当奇怪的错误。

即它正在注册安装但仍然无法正常工作。我会检查配置。按照说明归档

编辑2:

在尝试在 python 中导入库时,我得到了这个:

引用自://anaconda/lib/python2.7/site-packages/python-tesseract_0.8-3.0-py2.7_macosx-10.9-intel.egg/_tesseract.so

原因:找不到图片

老实说,对于任何这些幕后安装,我都是一个完全的业余爱好者,并且不得不广泛地使用谷歌搜索才能做到这一点。如果有一点知识的人可以阐明要尝试的明显事情,我将非常感激,因为我觉得好像我已经用尽了网络来寻找解决方案,并且接近于认为这个库不可用并试图编写我的拥有 ocr 库 - 100% 不是我期待的工作。或者,如果有人知道任何体面的 python ocr 库并提供良好的支持/安装维护,我很想了解它们(从我的谷歌搜索中,我怀疑 tesseract 是迄今为止最著名的,这就是为什么安装如此令人沮丧的原因好棘手)

我很乐意向任何愿意帮助解决此问题的战士提供有关我的系统等的更多信息。

谢谢!

0 投票
0 回答
624 浏览

python - Windows 8机器上的Python Tesseract错误

我已经在我的 C:\Python27 中安装了 Python2.7。这也被添加到环境变量中的路径中。

我有 numpy 和 OpenCV 工作。我用它做一些基本的图像处理。迄今为止,它工作得很好。

我必须在 OCR 上工作,我尝试按照从此处安装 Python-Tesseract 的说明进行操作,我已经安装了 32 位版本。

我打开了我的 Python,当我这样做时

它导入时没有任何错误或问题。

但是当我运行示例代码时,出现错误:

代码

错误

我查看了一些 stackoverflow 问题,但大部分内容我都无法理解。我也尝试重新安装它,这给了我同样的错误。

如果有人可以指导我 - 这会很有帮助。

另外,我知道 python-tesseract 网站说它们支持 Windows-7。不幸的是,我在 Windows-8 机器上设置了一些东西,我不想迁移。再次在许多地方看到此错误 - 但对于像我这样的新手来说,解决方案非常困难。

0 投票
2 回答
2565 浏览

python - 请在 pytesser 尝试识别之前调用 SetImage。0 错误

我正在尝试将文本图像转换为文本。我pytesser在 python 中使用,因为我已经安装了 tesseract,但甚至运行以下代码:

我收到以下错误:

什么都没有打印(没有结果)。对上述问题有任何帮助吗?

0 投票
3 回答
65722 浏览

python - 使用 Opencv 检测图像中的文本区域

我有一张图片,想检测其中的文本区域。

我尝试了 TiRG_RAW_20110219 项目,但结果并不令人满意。如果输入图像是http://imgur.com/yCxOvQS,GD38rCa它正在生成http://imgur.com/yCxOvQS,GD38rCa#1作为输出。

任何人都可以提出一些替代方案。我希望这可以通过仅将文本区域作为输入发送来改善 tesseract 的输出。

0 投票
1 回答
5943 浏览

python - 树莓派 python-tesseract 安装

几个月前,我创建了一个在树莓派上使用 python-tesseract 库的项目。从那以后我重新安装了 rasbpian,现在我想重新安装 python-tesseract 库。我遇到的问题是该库不再安装在树莓派上。raspberry-pi 从未得到官方支持,但可以安装。几个月前我使用的安装过程不再有效,我尝试了我能找到的一切,但没有任何效果。有人最近在 pi 上安装了 python-tesseract 吗?如果是,如何?

蟒蛇2.7

Raspbian 完全最新(包括固件)