“tesseract”的相关标签问题

0 投票

1 回答

9855 浏览

php - Tesseract 和 Php ocr

我希望使用 Tesseract 将大量图像文件转换为文本。

我查看了他们的文档，但不知道这与 PHP 有什么关系，以及我的 php 脚本将如何与 tesseract ocr 交互。我已经看到其他问题表明 php exec() 可能是这种方式。

我已经下载并安装了 tesseract。使用安装了最新版本的 xampp 的 Windows 7。我有 php 的初级到中级知识。我缺少什么知识？

更新我现在可以在 powershell 和 cmd 中使用它

但是当我尝试像这样通过 exec 运行它时：

我从 Windows 弹出一个窗口，提示 tesseract.exe 已停止工作。如果它们对任何人都意味着什么，这里是错误详细信息。

2011-01-18T23:39:44.883

0 投票

1 回答

3166 浏览

python - 在 Python 应用程序中使用 Tesseract OCR 的性能问题

我最近整理了一个界面，用于扫描和上传可搜索文档到我们的文档管理系统 KnowledgeTree。对于这个过程的不同部分，我们可以使用大量单独的工具，但我想将所有内容组合到一个界面中，以使用户的操作变得简单。

这是平台：

这是基本过程：

它工作得很好，除了第 2 步在某些类型的文档上非常慢。它在基本的固定宽度文本报告中滚动，但会在其中添加一些徽标、线条和其他不可读的内容，有时它可能会在单个页面上花费几分钟。更不用说如果它试图重新定向它最多可以重复 4 次。相比之下，扫描仪附带的软件使用 ABBYY OCR，可以在不到一分钟的时间内处理 50 多页，几乎完美地处理了页面布局和文本方向（我意识到这就是 ABBYY 花钱的原因）。不幸的是，使用此扫描软件对用户来说更加复杂，并且仅涵盖步骤 1-3。

我的问题是我是否应该以不同的方式处理这个问题，也许通过将 OCR/上传与扫描界面完全分开，是否有任何 OCR 包或其他我忽略的解决方案可以集成到 Python 应用程序中。我正在调用外部应用程序来完成工作这一事实会导致性能问题吗？

无论我在这里做什么，重要的是我可以控制第 4 步，因为要求用户手动设置每个上传文档的类型和元数据可能是个问题。

python ocr tesseract

2011-01-21T21:26:02.407

0 投票

1 回答

1970 浏览

.net - .Net 的 Tessnet2 - 在 tessocr.Init 调用时退出

我有一个在 Visual Studio 10、Windows Vista Home Premium 中运行的 .net 控制台应用程序。我正在尝试使 tessnet2 示例正常工作。这是我的代码：

应用程序在 tessocr.Init 调用时以代码 1 退出。

我已将所有 9 个 eng 语言文件放在应用程序的调试目录中。

不知道我还能做什么？

.net tesseract

2011-01-25T08:53:34.303

0 投票

3 回答

3053 浏览

android - 通过android NDK编译tesseract

我正在尝试使用 android ndk r5 为 android 编译 tesseract，通过检查https://android.googlesource.com/platform/external/tesseract获得 tesseract 的代码，我无法编译 tesseract 并出现错误，

我的 android.mk 看起来像这样，libjpeg 包含在 LOCAL_STATIC_LIBRARIES 中

请帮助我为 android 构建 tesseract。

android android-ndk tesseract

2011-01-26T18:08:15.503

0 投票

2 回答

4532 浏览

concurrency - Tesseract（OCR 引擎）是可重入的吗？

我在四核处理器上使用 Tesseract 进行 OCR。为了提高速度，我想一次阅读 4 个单词，使用 4 个线程。从多个线程同时调用 Tesseract 是否安全？

注意：每个线程将处理不同的非共享图像。

注意：由于速度原因，用锁守卫是不行的。

concurrency ocr tesseract reentrancy

2011-01-28T11:56:16.780

0 投票

5 回答

12629 浏览

iphone - iPhone 上的数字识别是否可以实时进行？

我需要从 iPhone 上的相机图像中实时识别数字。我知道图像上的数字不会超过 5 位。

考虑到 iPhone 的计算规格，这个问题是否真的可以解决？有没有人有使用 Tesseract OCR 库的经验，你认为可以通过使用它来解决吗？

iphone ocr tesseract vision

2011-02-03T14:24:08.777

0 投票

7 回答

40964 浏览

c# - Tesseract OCR 库 - 学习字体

好吧，我正在使用此 OCR 的已编译 .NET 版本，可以在 @ http://www.pixel-technology.com/freeware/tessnet2/找到

我有它的工作，但是这样做的目的是翻译车牌，遗憾的是引擎真的不能准确翻译一些字母，例如这是我扫描以确定字符问题的图像

在此处输入图像描述

结果：

12345B7B9U ABCDEFGHIJKLMNUPIJRSTUVHXYZ

因此，以下字符被错误地翻译：

1、O、Q、W

这似乎还不错，但是在我的车牌上，结果并不是那么好：

在此处输入图像描述 = H4 ODM

在此处输入图像描述 = LDH IFW

假测试

在此处输入图像描述 = NR4 y2k

正如您可能会说的那样，我已经尝试过降噪、增加对比度和移除不是绝对黑色的像素，但没有真正的改进。

显然你可以“学习”引擎的新字体，但我认为我需要为.NET重新编译库，而且这似乎是在我没有的 Linux 操作系统上执行的。

http://www.scribd.com/doc/16747664/Tesseract-Trainingfor-Khmer-LanguageFor-Posting

所以我不知道接下来要尝试什么，如果有人想尝试，我编写了一个纯粹用于测试目的的快速控制台应用程序。如果有人有任何想法/图形处理/图书馆想法，我会很高兴听到他们的声音。

c#image-processing ocr tesseract

2011-02-05T18:58:22.387

0 投票

1 回答

9814 浏览

ocr - 有没有办法用小字体改进 tesseract OCR？

我正在尝试通过 python-tesseract 使用 tesseract-OCR 来读取如下所示的低分辨率字体：

在此处输入图像描述

不幸的是，图像返回

我认为分辨率太低，这会导致问题。我尝试放大图像，并将其裁剪为单个字符，但这些都没有提供太大的改进。还有什么我应该考虑做的事情，最好是可以使用 Python Imaging Library 完成的事情？或者我应该放弃/训练 tesseract。

值得一提的是，PIL 具有以下内置过滤器：

BLUR、CONTOUR、DETAIL、EDGE_ENHANCE、
EDGE_ENHANCE_MORE、EMBOSS、FIND_EDGES、
SMOOTH、SMOOTH_MORE 和 SHARPEN

ocr tesseract python-imaging-library

2011-02-05T20:15:56.640

0 投票

10 回答

117438 浏览

ocr - 当它们与字母混合时，如何使 tesseract 只识别数字？

我想用它tesseract来识别数字。问题是我混合了数字和字母，当我使用SetVariable("tessedit_char_whitelist", "0123456789")
每个符号时，tesseract 返回错误的数字。

我可以设置一个阈值以tesseract省略相似度低的符号吗？

注意：我设置tesseract为只识别数字，因此 O 和 0 之间没有混淆。

ocr tesseract

2011-02-09T12:29:53.353

0 投票

1 回答

3303 浏览

ocr - 如何让 tesseract 在存在噪声的情况下给出相关结果？

我正在使用 tesseract 3.0.0，但遇到了以下问题：

当某些东西太小而无法识别时，它似乎与其他片段合并。结果没有返回任何相关内容。

下图显示了 3 个案例。只有带有虚线的矩形被传递给 tesseract。矩形上方是结果（V 上方 T 表示换行）。

最后一种情况是问题。在这种情况下有什么办法可以改善 tesseract 吗？

在此处输入图像描述

ocr tesseract

2011-02-09T12:57:46.043

问题标签 [tesseract]

Reference