问题标签 [python-tesseract]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
290 浏览

computer-vision - 进行 OCR 以识别写在卡车/汽车或其他车辆上的文本

我是计算机视觉世界的新手。

我正在尝试使用 Tesseract 检测写在卡车侧面的数字。

一辆卡车的图片取自维基百科

所以对于这个例子,我希望看到 CMA CGM 作为输出。

我通过命令行将此图像提供给 Tesseract

但它产生了一个空白文件。

然后我阅读了Tesserocr(Tesseract的python包装器)的文档并尝试了以下代码

再次它无法读取图像中的任何字符。

我的问题是我应该如何解决这个问题?(我不是在寻找现成的代码,而是在寻找如何解决这个问题的方法)。

我是否需要使用示例图像来训练 tesseract,或者我可以使用现有库编写代码以某种方式检测卡车的坐标并尝试仅在卡车的边界内进行 OCR?

0 投票
1 回答
562 浏览

opencv - 如何提高车辆文字的 OCR?

我正在尝试对火车或卡车等车辆进行 OCR,以识别写在上面的数字和字符。(请注意这不是车牌识别 OCR)

我拍了这张照片。这个想法是能够提取文本 - BN SF 721 734 写在上面。

在此处输入图像描述

对于预处理,我首先将此图像转换为灰度,然后将其转换为看起来像这样的二值化图像

在此处输入图像描述

我在 tesseract 中写了一些代码。

这段代码给了我一个置信度值为 95 的空白输出,这意味着 tesseract 有 95% 的信心认为该图像中不存在任何文本。

然后我在 Tesseract 中使用 setrectangle api 来限制图像中特定窗口的 OCR,而不是尝试对整个图像进行 OCR。

坐标 665、445、75 和 40 对应于图像中包含文本 BNSF 721 734 的矩形。665 - 顶部,445 - 左侧,75 - 宽度和 40 - 高度。

我得到的输出是这样的:

我的问题是如何改进结果?我玩弄了 setrectangle 函数中的值,结果略有不同,但都同样糟糕。

有没有办法改善这一点?

如果您对我如何将图像转换为二值化图像感兴趣,我使用 OpenCV

0 投票
0 回答
1040 浏览

python - Python Tesserocr 与 Leptonica Windows 10

我正在尝试在 Windows 10 中安装 tesserocr 包。

它给出如下错误:

tesseract_ocr.cpp(463):致命错误 C1083:无法打开包含文件:'leptonica/allheaders.h':没有这样的文件或目录

有什么解决办法??

谢谢

0 投票
2 回答
1080 浏览

python-2.7 - 如何使用 Tesseract 从车辆的认证卡中获取文本区域

我需要关于 tesseract 的建议。我曾尝试使用 Tesseract,但结果并不完美。很多信息都丢失了。我想扫描法国车辆的注册证书,我必须将数据恢复到数据库中。您可以在文件下方找到,这是一份法国注册证书。是否可以检测本文档中的每个区域并将此信息保存在数据库中?我在互联网上阅读过,仅使用 Tesseract 无法检测区域?

例如,您有区域 A、B、C.1、D.2.1。如何检测/扫描每个区域并将此信息插入数据库?

示例: https ://www.ecartegrise.fr/wp-content/uploads/2013/03/nouvelle-carte-grise-specimen.jpg

我想这样做:http: //www.adoc-solutions.eu/images/Documentations/cartes-grises.png

如何恢复每个区域文本并将其插入数据库?

谢谢你的帮助

尼古拉斯

0 投票
2 回答
5932 浏览

python - 两个 pip3 包之间的区别:pytesseract vs tesseract

这两个包有什么区别?

pip3 install pytesseract

pip3 install tesseract

0 投票
2 回答
12550 浏览

python - 没有名为 tesseract 的模块

处理 OCR。我可以导入 pytesseract 并使用 image_to_string 但我想解决这个问题:

这是将 tesseract 设置为仅检测数字或字母。当我运行我的代码时,我得到这个错误:

ImportError: No module named tesseract

我安装了 tesseract-ocr,也安装了 pytesseract。然而我不断收到这个错误。

0 投票
0 回答
326 浏览

python-3.x - 使用 tesseract image_to_string 函数传递单词列表或模式

我正在尝试使用 python 开发我的第一个 ocr 项目。我也是 Python 的新手。

我正在使用 OpenCV 3 和 Python 3.6。我正在尝试从文档中进行 OCR。

使用 OpenCV,我已将图像转换为白色背景和黑色文本。它可以很好地读取大部分图像。但为了提高准确性,我想将模式列表传递给 OCR 引擎。

这可能与 pytesseract 吗?

例如,我正在尝试提取客户 ID,并且可能只有少数客户 ID,我可以提供这些客户 ID 的列表以提高准确性。

与日期相同,我知道它始终采用特定的日期格式,如果我可以提供日期格式以提高准确性......

这些都有可能吗?如果是的话,有人可以建议我怎么做吗?

我试图搜索堆栈溢出和谷歌,但找不到太多帮助。

任何指导或方向都会有所帮助......

0 投票
1 回答
666 浏览

opencv - 如何使用 Tesseract 识别图像中另一个形状内的文本

灰度图像 我正在尝试识别六边形内的文本“25”。如果文本在六边形上方或下方,我的代码可以识别文本,但在六边形内部时则不能。任何指针?另外,我正在尝试获取文本的坐标。一种选择是将六边形(使用 opencv 轮廓)提取到另一个图像中,然后使用 tesseract。但是我可以使用更简单的解决方案吗?

这是识别文本是否在形状之外的代码片段(程序将图像文件名作为 arg 并打印出它识别的文本。)

0 投票
0 回答
1672 浏览

python - ModuleNotFoundError:没有名为“pytesser”的模块

我已成功安装 pytessearct(最新版本)并设置了环境路径(c:\users\hp\appdata\local\programs\python\python36-32\lib\site-packages)但是当我尝试要使用/导入 pytesseract 库,它显示没有名为“pytesser”的模块错误。

这是我要运行的程序-

错误图片 -

在此处输入图像描述

0 投票
2 回答
3099 浏览

python - 使用 pytesseract 检测孟加拉语字符

我正在尝试使用 python 从图像中检测孟加拉字符,所以我决定使用pytesseract。为此,我使用了以下代码:

问题是,如果我给出了一个英文字符的图像,就会被检测到。但是,当我lang="ben"从孟加拉语字符的图像中编写和检测时,我的代码会运行无穷无尽的时间或永远运行。

PS:我已将孟加拉语训练数据下载到 tessdata 文件夹,我正在尝试在PyCharm中运行它。

谁能帮我解决这个问题?

input.png 样本