问题标签 [python-tesseract]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
image-processing - 无法正确设置 tesseract
我正在尝试在此图像上使用 tesseract:
当我使用默认配置时:
它返回\KD FWOW
。
如您所见,唯一的错误是第一个字母L
被识别为反斜杠
因此,我/usr/share/tesseract-ocr/tessdata/configs
使用以下设置创建了一个配置文件:
tessedit_char_whitelist ABCDEFGHIJKLMNOPQRSTUWXYZ
目标是只识别字母,而不是特殊字符。但是,当我使用此配置运行 tesseract 时:
结果是XKD FVOIV
,现在它缺少一个以上的字符,主要是 'W'。
这对我来说毫无意义,我不明白为什么它在白名单上时停止识别 W。当然,我在配置中遗漏了一些东西。
我该如何解决?
python-3.x - 在 Python3 文本库中使用 tesseract
我想从 PDF 文件中提取文本。我可以成功安装 tesseract(它在终端中工作)和 textract(按照此说明)。
但是,当我运行代码时,出现错误。
错误是:
我尝试了几次修改,但它们从来没有工作,我得到了同样的错误。
return b''.join(contents)
contents = [str(item) for item in contents]
之前插入return
contents = [item.decode("utf-8") for item in contents]
之前插入return
php - PHP 无法在 Python 中执行 Pytesseract
我正在使用Postman将 base64 图像发送到我的 Apache Web 服务器上的 PHP 文件。图像始终发送成功。PHP 脚本执行 python 脚本以从图像中提取文本(使用 Pytesseract/Tesseract-OCR)并将输出发送回 PHP。(使用 Windows 10,如果这很重要)
前两个打印语句总是在 Postman 中返回,但第三和第四个打印语句不返回。仅当注释掉 pytesseract 行时,最后一个 print 语句才返回。
当我自己运行 python 脚本时,所有打印语句都成功返回。
Python (test.py)
PHP (连接.php)
php - PHP 无法通过 shell_exec() 在 Python 中执行 Pytesseract
我正在使用 Postman 将 base64 图像发送到我的 Apache Web 服务器上的 PHP 文件。图像始终发送成功。PHP 脚本执行 python 脚本以从图像中提取文本(使用 Pytesseract/Tesseract-OCR)并将输出发送回 PHP。(使用 Windows 10,如果这很重要)
前两个打印语句总是在 Postman 中返回,但第三和第四个打印语句不返回。仅当注释掉 pytesseract 行时,最后一个 print 语句才返回。
当我自己运行 python 脚本时,所有打印语句都成功返回。
Python (test.py)
PHP (连接.php)
我相信问题是能够运行 python 脚本,但 python 脚本在 PHP 执行时无法执行 tesseract。
python - 使用 Tesseract 和 Pyocr 在 Python 中获取字体大小
pyocr
是否可以使用或从图像中获取字体大小Tesseract
?下面是我的代码。
在这里,我使用函数从图像中获取文本image_to_string
。现在,我的问题是,如果我也能得到font-size
(数字)我的文字。
python - 有没有办法使用 tesseract ocr 或任何其他 python 包从检查中读取 micr 字体字符?
当我在支票上使用 pytesseract 进行字符识别时,没有正确识别 micr 字符。
python - 在 pytesseract 中运行示例代码
我正在运行 python 2.6.6 并想安装pytesseract包。解压安装后,我可以从命令行调用pytesseract。但是我想在 python 中运行 tesseract。我有以下代码(ocr.py):
当我通过 python ocr.py 运行代码时,我得到以下输出:
test.png 和 test-european.jpg 在工作目录中。有人可以帮我运行这段代码吗?我尝试了以下方法:
- 将 tesseract_cmd 调整为“pytesseract”
- 安装了 tesseract-ocr
感谢任何帮助,因为我现在正试图解决这个问题几个小时。
python - 通过 Boost 将图像从 Python 发送到 C++
我正在尝试使用 Boost 在 Python 上优化我的程序,并用 C++ 函数替换一些 Python 代码。
Python代码:
和 C++ 上的代码:
所以,我需要做两件事:
- 使用 . 将图像从 Python 发送到 C++
Boost.Python
。 - 将图像数组发送到 C++(我想通过在 C++ 中使用多威胁来提高性能)。