问题标签 [pytesser]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
0 回答
573 浏览

python - 使用 pytesser 运行 tesseract 时如何隐藏控制台窗口

我是 Python 新手。我正在从事 OCR 项目。我在 Windows 7 上使用 Python 2.7.12。我在路径“C:\Program Files (x86)\Tesseract-OCR”中安装了 tesseract

我在这里找到了 pytesser 库 v0.0.2:https ://searchcode.com/codesearch/view/11386640/#

当我运行代码时:

它调用 tesseract 并出现 tesseract.exe 窗口(参见图片:https ://www.dropbox.com/s/p0i6sjj61yhfnp9/question.png?dl=0 )。我想隐藏它,但我不知道该怎么做。我认为我必须更改库文件中的某些内容。有人可以帮助我吗?

0 投票
1 回答
17097 浏览

python - 导入 pytesseract

我试图将 pytesseract 用于 OCR(从图像中提取文本)。我已经使用以下命令成功安装了 pytessearct -

当我尝试再次安装它时,它清楚地表明 -

这意味着 pytessearct 安装成功。当我尝试使用 - 在我的 iPython 笔记本中导入这个包时 -

它抛出一个错误 -

为什么会这样?

0 投票
2 回答
18891 浏览

python - 从图像中读取文本

关于将这些图像转换为文本的任何建议?我正在使用 pytesseract,除此之外,它在大多数情况下都能正常工作。理想情况下,我会准确地阅读这些数字。最坏的情况我可以尝试使用 PIL 来确定“/”左侧的数字是否为零。从左边开始,找到第一个白色像素,然后

在此处输入图像描述 在此处输入图像描述

中间的斜线会导致这里出现问题。我还尝试使用 PIL 的“.paste”在图像周围添加大量额外的黑色。可能还有一些其他的 PIL 技巧我可以尝试,但除非我必须这样做,否则我宁愿不走那条路。

我尝试使用 config='-psm 10' 但我的 8 有时会以“:”的形式出现,而其他时候则是随机字符。而我的 0 则一无所获。

参考:pytesseract 不适用于 -psm 10 的一位数字图像

_____________编辑_______________ 其他示例:

在此处输入图像描述 1BJ2I]

在此处输入图像描述 DIS

在此处输入图像描述 10.I'10

在此处输入图像描述 20.I20

所以我正在做一些目前似乎有效的巫毒转换。但看起来很容易出错:

最终生成:

0 投票
1 回答
10217 浏览

python - OCR:从图像中提取文本

我正在开发从图像中提取文本的程序。为此,我尝试使用TessaractOcropus库,并且能够将简单的纯文本(带有简单字体的黑白)从图像转换为文本字符串。例如:

图 1 示例

但我无法从复杂图像中提取文本。例如,从这张图片中说:

图 2 示例

有谁知道如何实现这一目标?是否有任何库可用于从复杂图像中提取文本(具有不可预测的不同背景?我更喜欢 Python,但语言不是一个酒吧。

0 投票
3 回答
3111 浏览

python-3.x - 使用pytesseract时出现python FileNotFoundError

我试图捕获当前屏幕的一部分以检测屏幕上的某个数字,但是当代码运行时出现此错误:

源代码:

请有人告诉我为什么,以及如何解决?

0 投票
1 回答
218 浏览

python-2.7 - pytesser 设置模式文件的路径

在大学工作,我遇到了无法更改 tessdata 中的“数字”等配置文件的问题,因为我没有管理员权限。所以我想在家里运行一切,在那里创建模式、配置和训练数据文件。像这样开始我的检测适用于预期的输出:

即通过设置我运行tesseract 的路径。但是如何在 pytesser 调用 tesseract 的行中包含这条路径(最好是绝对路径)?它看起来如下

这是行不通的。仅使用数字作为路径会从我不想要的通用程序和文件存档中提取数字文件。

在此处包含绝对路径以告诉 tesseract 从何处绘制配置文件的方法是什么?或者那不可能?任何提示将不胜感激!

0 投票
0 回答
987 浏览

python-2.7 - Python上的CAPTCHA识别算法

我正在尝试使用 Python、OpenCV 和 Tesseract 设计一种验证码识别算法。问题是验证码数字在图像中未对齐并随机聚集。Pytesseract 大部分时间都失败并返回空列表。数据看起来像: 这应该返回 41332 这应该返回 35545

数字在一行中的相对平坦的 CAPTCHA 可以更好地检测到。我该如何解决这个问题?如何检测、裁剪和重新对齐此类图像中的数字,以使 tesseract(如果需要使用)更容易检测到它们?

0 投票
1 回答
562 浏览

opencv - 如何提高车辆文字的 OCR?

我正在尝试对火车或卡车等车辆进行 OCR,以识别写在上面的数字和字符。(请注意这不是车牌识别 OCR)

我拍了这张照片。这个想法是能够提取文本 - BN SF 721 734 写在上面。

在此处输入图像描述

对于预处理,我首先将此图像转换为灰度,然后将其转换为看起来像这样的二值化图像

在此处输入图像描述

我在 tesseract 中写了一些代码。

这段代码给了我一个置信度值为 95 的空白输出,这意味着 tesseract 有 95% 的信心认为该图像中不存在任何文本。

然后我在 Tesseract 中使用 setrectangle api 来限制图像中特定窗口的 OCR,而不是尝试对整个图像进行 OCR。

坐标 665、445、75 和 40 对应于图像中包含文本 BNSF 721 734 的矩形。665 - 顶部,445 - 左侧,75 - 宽度和 40 - 高度。

我得到的输出是这样的:

我的问题是如何改进结果?我玩弄了 setrectangle 函数中的值,结果略有不同,但都同样糟糕。

有没有办法改善这一点?

如果您对我如何将图像转换为二值化图像感兴趣,我使用 OpenCV

0 投票
1 回答
559 浏览

python - HEROKU 打开数据文件 /app/vendor/tesseract-ocr/tessdata/eng.traineddata 时出错

我有一个部署在 Heroku 中的 Django 应用程序。我正在尝试使用pytesseractError opening data file /app/vendor/tesseract-ocr/tessdata/eng.traineddata从图像中读取文本。我可以在 localhost 中毫无问题地运行此应用程序,但在 heroku 中,即使我添加了此处提到的pytesseract buildpacks ,它也会显示错误

0 投票
1 回答
4126 浏览

python-2.7 - Python Ocr车牌识别

我尝试使用自适应阈值和 Thesh_Binary_Inv 将图像转换为灰色

并尝试使用 pytesser 获取车牌,但得到了一些随机值作为输出

谁能帮我从图像中提取文本以及在哪里可以找到有关如何使用 kmeans 或任何其他算法进行训练的教程