我正在按照这些说明为新字体训练 Tesseract OCR 引擎。
但是,在尝试制作 box 文件时,出现错误。这是我使用的命令:
H:\Documents\TesseractTraining>tesseract eng.helvetica.exp0.tif eng.helvetica.exp0 batch.nochop makebox
这是错误消息:
Tesseract Open Source OCR Engine v3.02 with Leptonica
TIFFstream: Sorry, can not handle image.
Unsupported image type.
一些谷歌搜索表明 Leptonica 安装可能存在错误。我什至不知道我的计算机上是否安装了 Leptonica,并且该网页与几个自述文件(一个称为“自述文件”和一个称为“文档”)相当混乱,它们都不够简单,我无法理解如何制作它在 Windows 上工作。我有 Visual Studio 2008 的 Express Edition,所以我不能使用建议的命令提示符。
所以,我的问题是:有谁知道可能出了什么问题以及我如何解决它?