问题标签 [python-tesseract]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - 图像到文本 - 在 python 2.7 中删除非 ascii 字符
我正在使用 pytesser 对一个小图像进行 OCR 并从中获取一个字符串:
但是,pytesser 有时喜欢识别并返回非 ascii 字符。当我现在想打印我刚刚识别的内容时,就会出现问题。在 python 2.7(这是我正在使用的)中,程序崩溃了。
有什么方法可以让 pytesser 不返回任何非 ascii 字符?也许您可以在 tesseract OCR 中更改某些内容?
或者,是否有某种方法可以测试非 ascii 字符的字符串(不会使程序崩溃),然后不打印该行?
有些人会建议使用 python 3.4,但根据我的研究,pytesser 似乎无法使用它:Python 3.4 中的 Pytesser: name 'image_to_string' is not defined?
python - 如何删除“Tesseract Open Source OCR Engine v3.02 with Leptonica”消息
当我使用 pytesser(用于 python 的带有 tesseract-ocr 的图像处理库)并运行时:
结果我得到了text
, 以及来自 tesseract 的这一行:
我认为这条线在image_to_string
函数运行时运行。
这确实阻塞了控制台中打印的输出。而且真的很烦人。有谁知道如何摆脱它?也许是python中的一行或什么?
python - 为什么 pytesseract 不能识别个位数?
我在一个网站上执行 ocr,特别是在这两个图像上:
我对 OCR 相当陌生,我使用以下内容:
在第二张图片中,它可以识别除单个数字 3、4、5、6 之外的所有内容。
在第一张图片中,它也无法识别单个数字。
我通过调整图像大小、反转图像和使用阈值来预处理图像。
这是一种标准字体,所以我知道还有其他方法可以做到这一点,但在一定程度上它对我有用,所以我想在进入更高级的东西之前保持简单。
ocr - 我可以在 Windows 命令行中测试 tesseract ocr 吗?
我是 tesseract OCR 的新手。我试图将图像转换为 tif 并运行它以查看 tesseract 在 windows 中使用 cmd 的输出,但我做不到。你能帮助我吗?将使用什么命令?
这是我的示例图片:
python - python tesseract获取没有OCR的行数
我试图在不进行 OCR 的情况下确定文本行数。我想绕过 OCR 并在用户处理太多文本行时给他们一个错误(这将花费太长时间,而且这不是应该给出的那种输入)。理想情况下,我希望在 python 中执行此操作,但如果有任何 c++ 示例可以执行此操作,我可能会对其进行调整。
以下是我可以使用的 API 函数:http: //zdenop.github.io/tesseract-doc/group___advanced_a_p_i.html
我可以使用这些函数,但我不知道如何在 python 中处理 BLOCK_LIST、ETEXT_DESC 或 Boxa 对象,除非将它们从一个 API 调用提供给另一个。
任何帮助将不胜感激!
python - python tesseract "AttributeError: setImage"
我正在尝试让 tesseract 在 python 中运行:
我得到一个错误: raise AttributeError(name) AttributeError: setImage 我不知道为什么。请问,有人可以帮帮我吗?
tesseract - 强迫 Tesseract 给出一些答案
我正在尝试识别一行手写数字。目前我使用 Python 和 OpenCV 进行一些预处理,将图像拆分为连接的组件,并将这些组件提供给 Tesseract,PSM=10(页面分割模式,10 是“将图像视为单个字符”)和限制为“0123456789”的字符白名单”。我希望 Tesseract 在我的连接组件分割失败时返回垃圾,并在我的分割成功时返回一个数字。Tesseract 通常什么都不返回。
我已经尝试将pytesseract和python-tesseract作为 Python 的 Tesseract 接口。Pytesseract 的工作原理是找到可执行文件tesseract.exe
,使用 shell 中的合适参数运行它并收集答案。这就是我发现我的问题的方式。之后,我尝试了 python-tesseract,它实现了一个成熟的 C API。结果自然是一样的。
下面是我分别输入 Tesseract 的 5 张图片的示例(我还在这里上传了相同的图片作为单独的文件):
我在这些图像上得到 1,*,4,*,*,* 表示 Tesseract 只返回空格。
使用其他页面分割模式,我得到以下信息:
奇怪的是,当我运行tesseract image.png image -l eng -psm 10 digits-only
这些图像时,它返回 *,*,4,9,*。(digits-only
是tessedit_char_whitelist 0123456789
)
我如何强迫 Tesseract 给我一些答案而不是什么都没有?
python - Tesseract 在琐碎的输入图像上失败。段错误
我正在写一篇关于使用 Tesseract 在 Flask 中实现简单 OCR Web API 的教程。到目前为止,这已被证明很棒,但我目前遇到了一个奇怪的问题。
这是我们所看到的:
(Pdb) ENGINE.process_image(image)
*** TesseractError: (-11, 'index >= 0 && index < size_used_:Error:Assert failed:in file ../ccutil/genericvector.h, line 512')
现在,我已经尝试了以下方法。我相信这只是安装的一个简单问题......
运行 tesseract -v 让我:
``` (codys_app)bobby@devbox:~/ocr/flask_server$ tesseract -v tesseract 3.02.02 leptonica-1.70 libjpeg 8d:libpng 1.2.50:libtiff 4.0.3:zlib 1.2.8
```
我已经尝试卸载它并通过 apt-get 重新安装,并从源代码重新构建它。我没有运气。
我的 TESSDATA 环境变量是TESSDATA_PREFIX=/usr/local/share/
有任何想法吗?到目前为止,我在设置和构建过程中所采取的确切步骤以及完整的源代码可在此处找到 https://github.com/rhgraysonii/ocr_tutorial
任何帮助都非常感谢。这里的目标是帮助其他人进入 OCR,但遗憾的是我无法让它正常工作。
干杯! 并提前感谢您的帮助
linux - Python3x 的 Tesseract-OCR 模块安装错误
我想将 tesseract-ocr 库与 python-3.4 一起使用。我用“sudo apt-get install tesseract-ocr”下载了 tesseract,现在我可以在命令行中使用它了。但我想将它与 python3 一起使用。但我找不到任何将本机 tesseract 与 python3x 一起使用的教程。
实际上我尝试使用像 pytesseract 这样的包装器。我从https://code.google.com/p/python-tesseract/wiki/Python3Tesseract下载并使用 dpkg 安装它。我试图导入它,但我得到一个奇怪的错误。
错误信息是;
“ImportError:/usr/lib/python3/dist-packages/_tesseract.cpython-34m-x86_64-linux-gnu.so:未定义符号:_Z11GetUTF8TextPN9tesseract11TessBaseAPIE”
我尝试了 python3x 的 tesserPy 包装器。它适用于土耳其语、英语,但不适用于阿拉伯语。(我只为这些语言测试了 tesserpy。)你可以从那个地址得到 tesserpy; https://github.com/blindsightcorp/tesserpy
这是我为阿拉伯语运行 tesserpy 时的错误消息;
tessdata_manager.SeekToStart(TESSDATA_INTTEMP):Error:Assert failed:in file adaptmatch.cpp, line 511
有没有人看到过这种错误信息?
提前致谢
tesseract - Tesseract OCR 无法识别全高数字
我只测试了字母数字和数字的示例文本。我正在使用数字模式。
如何识别下图中的数字:
我认为是因为身高。我还尝试使用一些在线工具(不是代码)将其转换为 .jpg
我正在使用 pytesseract 0.1.6,但我认为这是 Tesseract 问题。
这是我的代码: