问题标签 [python-tesseract]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
opencv - 如何提高车辆文字的 OCR?
我正在尝试对火车或卡车等车辆进行 OCR,以识别写在上面的数字和字符。(请注意这不是车牌识别 OCR)
我拍了这张照片。这个想法是能够提取文本 - BN SF 721 734 写在上面。
对于预处理,我首先将此图像转换为灰度,然后将其转换为看起来像这样的二值化图像
我在 tesseract 中写了一些代码。
这段代码给了我一个置信度值为 95 的空白输出,这意味着 tesseract 有 95% 的信心认为该图像中不存在任何文本。
然后我在 Tesseract 中使用 setrectangle api 来限制图像中特定窗口的 OCR,而不是尝试对整个图像进行 OCR。
坐标 665、445、75 和 40 对应于图像中包含文本 BNSF 721 734 的矩形。665 - 顶部,445 - 左侧,75 - 宽度和 40 - 高度。
我得到的输出是这样的:
我的问题是如何改进结果?我玩弄了 setrectangle 函数中的值,结果略有不同,但都同样糟糕。
有没有办法改善这一点?
如果您对我如何将图像转换为二值化图像感兴趣,我使用 OpenCV
python - Python Tesserocr 与 Leptonica Windows 10
我正在尝试在 Windows 10 中安装 tesserocr 包。
它给出如下错误:
tesseract_ocr.cpp(463):致命错误 C1083:无法打开包含文件:'leptonica/allheaders.h':没有这样的文件或目录
有什么解决办法??
谢谢
python-2.7 - 如何使用 Tesseract 从车辆的认证卡中获取文本区域
我需要关于 tesseract 的建议。我曾尝试使用 Tesseract,但结果并不完美。很多信息都丢失了。我想扫描法国车辆的注册证书,我必须将数据恢复到数据库中。您可以在文件下方找到,这是一份法国注册证书。是否可以检测本文档中的每个区域并将此信息保存在数据库中?我在互联网上阅读过,仅使用 Tesseract 无法检测区域?
例如,您有区域 A、B、C.1、D.2.1。如何检测/扫描每个区域并将此信息插入数据库?
示例: https ://www.ecartegrise.fr/wp-content/uploads/2013/03/nouvelle-carte-grise-specimen.jpg
我想这样做:http: //www.adoc-solutions.eu/images/Documentations/cartes-grises.png
如何恢复每个区域文本并将其插入数据库?
谢谢你的帮助
尼古拉斯
python - 两个 pip3 包之间的区别:pytesseract vs tesseract
这两个包有什么区别?
pip3 install pytesseract
pip3 install tesseract
python - 没有名为 tesseract 的模块
处理 OCR。我可以导入 pytesseract 并使用 image_to_string 但我想解决这个问题:
这是将 tesseract 设置为仅检测数字或字母。当我运行我的代码时,我得到这个错误:
ImportError: No module named tesseract
我安装了 tesseract-ocr,也安装了 pytesseract。然而我不断收到这个错误。
python-3.x - 使用 tesseract image_to_string 函数传递单词列表或模式
我正在尝试使用 python 开发我的第一个 ocr 项目。我也是 Python 的新手。
我正在使用 OpenCV 3 和 Python 3.6。我正在尝试从文档中进行 OCR。
使用 OpenCV,我已将图像转换为白色背景和黑色文本。它可以很好地读取大部分图像。但为了提高准确性,我想将模式列表传递给 OCR 引擎。
这可能与 pytesseract 吗?
例如,我正在尝试提取客户 ID,并且可能只有少数客户 ID,我可以提供这些客户 ID 的列表以提高准确性。
与日期相同,我知道它始终采用特定的日期格式,如果我可以提供日期格式以提高准确性......
这些都有可能吗?如果是的话,有人可以建议我怎么做吗?
我试图搜索堆栈溢出和谷歌,但找不到太多帮助。
任何指导或方向都会有所帮助......
python - 使用 pytesseract 检测孟加拉语字符
我正在尝试使用 python 从图像中检测孟加拉字符,所以我决定使用pytesseract。为此,我使用了以下代码:
问题是,如果我给出了一个英文字符的图像,就会被检测到。但是,当我lang="ben"
从孟加拉语字符的图像中编写和检测时,我的代码会运行无穷无尽的时间或永远运行。
PS:我已将孟加拉语训练数据下载到 tessdata 文件夹,我正在尝试在PyCharm中运行它。
谁能帮我解决这个问题?