“python-tesseract”的相关标签问题

0 投票

1 回答

633 浏览

python - 在python中为本地语言实现OCR

我需要在 python 中为我家乡的一种区域语言实现 OCR。

我四处搜索并阅读了有关 Tesseract OCR 引擎的信息。但它支持有限的语言。

如何修改它以支持其他语言？

2015-07-21T19:07:49.583

0 投票

1 回答

2689 浏览

tesseract - 如何在 python-tesseract 中设置 tessedit_write_images？

我正在尝试设置tessedit_write_images但似乎无法做到，我在任何地方都看不到 tessinput.tif

我正在做：

但我尝试过使用“True”、“1”和其他一些变体，似乎根本不起作用。

有什么帮助吗？

tesseract python-tesseract

2015-07-22T10:45:10.343

0 投票

1 回答

6081 浏览

python - tesseract 从表中读取值

我的问题是关于使用 OCR 从图像中的表中提取数据的这篇文章。

我正在使用tesseract将表格图像转换为文本。除了不保留表格的格式外，这很好用。一种解决方案是用一些字母替换列，这些字母tesseract会识别并欺骗它把表格当作一些文本。

这是一个没有列的表的示例

我使用以下代码绘制“QQ”的列

这给了我以下图片

问题是 tesseract 甚至可以识别 QQ。我也是在空白页写QQ栏，tesseract不认识。

有没有办法使用 tesseract 将此表以 png 格式转换为文本？有什么东西让我逃脱了吗？

python tesseract python-tesseract

2015-07-25T10:33:42.677

0 投票

2 回答

4399 浏览

tesseract - 正方体安静模式

在 Ubuntu 下，我在 3.02 版本中使用 tesseract-ocr。特别是python的包装器pytesseract，但这个问题也是关于命令行工具的。

在 https://code.google.com/p/tesseract-ocr/wiki/FAQ#How_can_I_make_the_error_messages_go_to_tesseract.log_instead_of下的常见问题解答中

写的是有一个选项/配置文件“安静”抑制了 tesseract 的信息行。

但是，当我使用此选项调用 tesseract 命令行时，它会说

“read_params_file：无法安静地打开”

没错，在相应的配置文件夹中没有“安静”的配置文件。

我在哪里可以获得它或如何创建它？

我要禁止的信息行是：“Tesseract Open Source OCR Engine v3.02 with Leptonica”。

tesseract python-tesseract

2015-08-04T10:19:29.660

0 投票

1 回答

3422 浏览

python - 在 Linux 系统上安装 Python-Tesseract

我在我的 linux 系统上安装 python-tesseract 时遇到问题。我一直在使用本教程： http ://delimitry.blogspot.be/2014/10/installing-tesseract-for-python-on.html

我得到的错误是：

在按顺序执行其余说明后运行python setup.py clean时。/python-tesseract

在这个系统上运行 linux 3.2.0-4-amd64。

Whereis tesseract-ocr返回：

Whereis leptonica返回：

Whereis tesseract返回：

我还尝试运行其他一些教程/指南来安装 python-tesseract，它们返回了其他错误，例如缺少 libleptonica 然后缺少 libc6，但我没有对这些进行过多调查。只是想看看是否有任何其他指南立即起作用。此外，当我在终端中运行 tesseract 时，它可以工作，但 import tesseract 没有。

我究竟做错了什么？我该如何解决这个问题并安装 python-tesseract？

python linux runtime-error tesseract python-tesseract

2015-08-07T10:02:40.713

0 投票

1 回答

2572 浏览