问题标签 [pytesser]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
658 浏览

python - 使用 Pytesser 从图像中提取文本

我已经安装了 Pytesser 从图像中提取文本

上面的命令正在工作,但是当我输入代码时

我得到错误:

**

回溯(最后一次调用):文件“C:\Users\Anmol\Desktop\PYTHON\text_image.py”,第 23 行,在 image_to_string(image) 文件“C:\Python27\lib\site-packages\pytesser.py ",第 31 行,在 image_to_string call_tesseract(scratch_image_name, scratch_text_name_root) 文件 "C:\Python27\lib\site-packages\pytesser.py",第 21 行,在 call_tesseract proc = subprocess.Popen(args) 文件 "C:\Python27 \lib\subprocess.py",第 390 行,在init errread,errwrite) 文件 "C:\Python27\lib\subprocess.py",第 640 行,在 _execute_child startupinfo) WindowsError: [错误 2] 系统找不到文件指定的**

Plzz 指导我做什么,因为我是 Python 新手。

0 投票
1 回答
457 浏览

computer-vision - 使用一些 OCR 提高文本提取效率

我对计算机视觉非常陌生。我有很多这样的图像:

示例图像

我想将整个表格提取为文本。我试图pytesseract从图像中提取文本。我尝试了如下示例代码:

但结果真的很糟糕。一些样本:

我怎样才能提高效率?我能达到 80-90% 的准确率吗?我所有的图像都是相同的格式。那么我可以提高我的用例的准确性吗?任何建议都会有所帮助。

更新:我尝试使用 OCR.space,但它根本不适用于以下图像:

测试

0 投票
0 回答
1672 浏览

python - ModuleNotFoundError:没有名为“pytesser”的模块

我已成功安装 pytessearct(最新版本)并设置了环境路径(c:\users\hp\appdata\local\programs\python\python36-32\lib\site-packages)但是当我尝试要使用/导入 pytesseract 库,它显示没有名为“pytesser”的模块错误。

这是我要运行的程序-

错误图片 -

在此处输入图像描述

0 投票
1 回答
2033 浏览

python-2.7 - 如何在 windows 8.1(win64) 中安装 Pytesseract (visual studio 2012+python+anaconda)

我在安装 tesseract orc 后使用此代码。

Traceback(最近一次调用最后一次):文件“C:\Users\Uzel\Documents\Visual Studio 2012\Projects\module3.py”,第 28 行,在 from tesseract import image_to_string ImportError: cannot import name image_to_string

我有这个错误。我试过 pytesseract 但我无法管理。我们能不能解决这个问题。如何?谢谢你。

0 投票
1 回答
1743 浏览

python - Pytesseract 转换期间的“ValueError:无法过滤调色板图像”

对于 Pytesseract 的以下代码,此错误代码有问题。(Python 3.6.1,Mac OSX)

从 PIL 导入 pytesseract 导入请求 从 PIL 导入图像 从 io 导入 ImageFilter 导入 StringIO,BytesIO

错误:

看起来很简单,但不起作用。任何帮助将不胜感激。

0 投票
1 回答
9295 浏览

python-3.x - 通过 pytesseract 和 PIL 提高文本识别的准确性

所以我试图从图像中提取文本。并且由于图像的质量和尺寸不好,它会给出不准确的结果。我用 PIL 尝试了一些增强功能和其他东西,但这只会降低图像质量。

有人可以建议对图像进行一些增强以获得更好的结果。图片的几个例子:

二

三

0 投票
1 回答
2479 浏览

python - 将图像转换为字符串时出现pytesseract错误

我不断收到以下代码错误:

错误是:

我不确定这是安装问题还是其他问题。我阅读了OSError: [Errno 2] No such file or directory using pytesser的答案,但他们没有帮助我。

0 投票
2 回答
2645 浏览

python - Pytesseract 不接受 pyautogui 截图,Windows,Python 3.6

我想要做的是用 pyautogui 制作一个数字的屏幕截图,然后用 pytesseract 将数字转换为字符串。代码: import pyautogui import time import PIL from PIL import Image import pytesseract

现在看来 pytesseract 不接受 pyautogui 创建的屏幕截图。代码运行良好,没有问题,但打印一个空字符串。但是,如果我在绘画中创建图像,并将其作为“output.png”保存到正确的文件夹中,就像截屏一样,它确实可以工作。

调整大小和调整后的图像输出

有人知道我在哪里遗漏了什么吗?

0 投票
1 回答
495 浏览

python - ImportError:没有名为“tesserwrap”的模块

Tesseract 已安装在我的系统中,尝试安装 tesserwrap 但出现错误

使用命令安装 Tesseract -

尝试使用命令安装 Tesserwrap 模块-

有没有其他方法可以安装 Tesserwrap?

0 投票
1 回答
857 浏览

python-2.7 - OCR - pytesseract 问题

我正在尝试应用以下代码:

但作为回报我得到

* 我已经尝试安装 tesseract-ocr

但它最终对我来说:

#

当我尝试不同的代码时:

与上述相同的故事:

问题是——如何从上述问题中走出来 | 以及为什么我第一次看到这些问题