c++ - Tesseract 或任何其他 OCR 库

Question

我正在寻找如何在 C++ 中使用（和训练？）Tesseract 的解释/API 文档/示例，在 google Tesseract 页面上没有任何用处，但在网络上还没有找到。

任何有用的资源和经验都会受到欢迎，因为我不知道如何开始。

PS：

我愿意就其他图书馆提出建议。
只有免费的图书馆

score 4 · Accepted Answer

我对 Tesseract 有一些经验......一个简单的“训练 tesseract”谷歌显示了这个页面： http ://code.google.com/p/tesseract-ocr/wiki/TrainingTesseract 您必须在其中选择要训练的 tesseract 版本。虽然 3 是最新版本，但它是全新的，因此人们仍在解决任何问题 - 我仍在使用 2.4 版。无论如何，您会看到针对特定“语言”（或者应该称为“字体”或“字符集”）训练 tesseract 大约需要 9 个步骤。您也可以只使用现有的“eng”语言——但这取决于您的应用程序。例如，在我的应用程序中，我必须进行文档分析并获取特定区域并想要 OCR 一个 13 个字符的数字字符串 - 我需要高精度 - 我不希望它读取 '5' 作为' S' 和 '0' 作为 'O' 等，因此创建特定的“语言”是合乎逻辑的

score 0 · Accepted Answer

Tesseract Ocr 是一个用于检测光学字符的开源库。如果您使用的是 Visual Studio，则只需包含库文件。如果您使用的是 qt creator，那么您必须构建库才能在 QT 上工作。您需要使用 CMakelist 或 Cmake Gui 来构建库。您可以访问链接 Opencv Ocr build for Qt 5.4 mingw

c++ - Tesseract 或任何其他 OCR 库

2 回答 2

Related

Reference