问题标签 [pytesser]

问问题

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

102 问题

0 投票

1 回答

278 浏览

python - 在 Python3.5:NameError: name 'image_to_string' 未定义

我试图打印 pytesser，它告诉我名称 'pytesser' 没有定义。我有 import pytesser，但我不知道为什么它没有定义？

python pytesser

2017-06-11T11:46:55.980

0 投票

1 回答

1226 浏览

windows - 当我使用 pytesseract 和 CREATE_NO_WINDOW 运行 tesseract 时如何隐藏控制台窗口

我正在使用 tesseract 在屏幕抓图上执行 OCR。我有一个使用 tkinter 窗口的应用程序，在我的类的初始化中利用 self.after 在 tkinter 窗口中执行恒定的图像抓取和更新标签等值。我已经搜索了多天，但找不到任何具体示例如何在使用 pytesseract 调用 tesseract 的 Windows 平台上将 CREATE_NO_WINDOW 与 Python3.6 结合使用。

这与这个问题有关：

使用 pytesser 运行 tesseract 时如何隐藏控制台窗口

我只用了 2 周的 Python 编程，不明白什么/如何执行上述问题中的步骤。我打开了 pytesseract.py 文件并查看并找到了 proc = subprocess.Popen(command, stderr=subproces.PIPE) 行，但是当我尝试对其进行编辑时，我遇到了一堆我无法弄清楚的错误。

我正在利用的代码类似于类似问题中的示例：

当它到达下一行时，黑色控制台窗口会闪烁不到一秒钟，然后在运行命令时关闭。

这是控制台窗口的图片：

程序文件 (x86)_Tesseract

这是另一个问题的建议：

您目前在 IDLE 中工作，在这种情况下，我认为弹出控制台窗口并不重要。如果您打算使用此库开发 GUI 应用程序，则需要修改 pytesser.py 中的 subprocess.Popen 调用以隐藏控制台。我首先尝试 CREATE_NO_WINDOW 进程创建标志。– 埃克森

对于如何使用 CREATE_NO_WINDOW 修改 pytesseract.py 库文件中的 subprocess.Popen 调用，我将不胜感激。我也不确定 pytesseract.py 和 pytesser.py 库文件之间的区别。我会在另一个问题上发表评论以要求澄清，但直到我在这个网站上获得更多声誉后我才能这样做。

windows python-3.x ocr tesseract pytesser

2017-06-24T03:02:15.907

0 投票

0 回答

76 浏览

python - 本地化和识别图像文件中的文本并将它们保存到文本文件或 .xls 文件中

我有一个包含表格形式的字符和数字的图像文件，我想用 python 编写代码，通过它可以识别文件的内容并将其保存到文本文件中，其顺序与图像文件相同。

输入图像文件是这样的。

编辑::这是使用后的结果textcleaner。输入文件输出文件输出文本文件

最终编辑:: 我按照这个链接对输入图像进行预处理，这是我的代码的链接，但结果没有改善，所以请帮助我我应该做些什么才能得到准确的结果。

python image-processing pytesser

2017-06-30T12:20:44.180

0 投票

1 回答

480 浏览

python-3.x - 无法使用 pytesseract 从图像中提取文本

我正在编写一个 python 脚本来使用 pytesseract 从文件中提取图像。但是当我运行脚本时，出现以下错误。

收到错误：

您能否指出我在这里所做的错误。

python-3.x pytesser

2017-07-01T17:04:22.660

0 投票

1 回答

2455 浏览

python - 从图像中获取文本

我需要使用 pytesseract 从这张图片中提取文本：在此处输入图片描述

但是，我使用了 pytesseract。它不会工作。这是我的代码：

python image pytesser

2017-07-11T07:02:00.930

0 投票

1 回答

4509 浏览

python - 在 Windows CMD 上尝试 Tesseract

我在将 Tesseract-OCR 与 pytesseract Python 包装器一起使用时遇到问题。我认为问题可能来自 Tesseract 本身，而不是包装器。所以我在 CMD 中尝试了 Tesseract：

它返回了以下几行：

我已经完成了以下安装 Tesseract 的操作：

从那里安装：https ://github.com/UB-Mannheim/tesseract/wiki
将 tesseract.exe 的路径添加到 PATH 环境变量中

顺便说一句，我在运行 Python 代码时遇到的问题：

是：

以管理员身份运行代码并不能解决问题

非常感谢你的帮助！

python tesseract pytesser

2017-07-19T09:34:00.767

0 投票

3 回答

2966 浏览

python - pytesseract 和 image.tif 文件

我需要使用 pytesseract 将包含几页的 image.tif 转录为文本。我有下一个代码：

问题是只提取第一页。我怎样才能提取所有这些？

python python-tesseract pytesser

2017-07-25T01:07:12.257

0 投票

2 回答

280 浏览

python - 在 Pytesser3 中未找到错误

我试图制作一个简单的 OCR 程序，但每当我运行它时，都会出现以下错误。我什至卸载了 pytesser3 并重新安装了它，但没有任何改变。我究竟做错了什么？

这是test.png： https ://i.stack.imgur.com/NBjbc.png

我做了你说的，但现在我有一个不同的错误：

python python-3.x ocr pytesser

2017-07-25T13:34:44.070

0 投票

1 回答

700 浏览

python - 如何在 Debian 上安装 pytesser？

我想在我的 python 脚本中使用image_to_string从图像中读取数字。我从 pytesser 导入所有内容 from pytesser import *

我读了这个问题并且

我安装了pytesseract

和tesseract-ocr

但我已经有这个错误了！

我的安装有什么问题？

python debian pytesser

2017-08-17T17:44:35.173

0 投票

5 回答

14242 浏览

python - tesseract 的 OCR 结果高度不一致

这是原始屏幕截图，我将图像裁剪为 4 个部分，并尽可能清除图像的背景，但 tesseract 仅检测到此处的最后一列而忽略其余部分。

显示了 tesseract 的输出，因为它有空格，我在处理结果时删除了这些空格

显示了 tesseract 的输出，因为它有空格，我在处理结果时删除了这些空格

我只是倾销的输出

但我不知道如何从这里开始以获得一致的结果。无论如何，我可以强制 tesseract 识别文本区域并使其扫描它。因为在训练器（SunnyPage）中，默认识别上的 tesseract 扫描它无法识别某些区域，但是一旦我手动选择所有区域，就会检测到所有内容并正确翻译为文本

代码

python opencv python-tesseract pytesser

2017-09-13T19:32:59.830

1 2 3 4 5 6 7 8 9 10