0

我正在按照这些说明为新字体训练 Tesseract OCR 引擎。

但是,在尝试制作 box 文件时,出现错误。这是我使用的命令:

H:\Documents\TesseractTraining>tesseract eng.helvetica.exp0.tif eng.helvetica.exp0   batch.nochop makebox

这是错误消息:

Tesseract Open Source OCR Engine v3.02 with Leptonica
TIFFstream: Sorry, can not handle image.
Unsupported image type.

一些谷歌搜索表明 Leptonica 安装可能存在错误。我什至不知道我的计算机上是否安装了 Leptonica,并且该网页与几个自述文件(一个称为“自述文件”和一个称为“文档”)相当混乱,它们都不够简单,我无法理解如何制作它在 Windows 上工作。我有 Visual Studio 2008 的 Express Edition,所以我不能使用建议的命令提示符。

所以,我的问题是:有谁知道可能出了什么问题以及我如何解决它?

4

1 回答 1

3

看起来你的形象很糟糕。您可以使用jTessBoxEditor工具创建适合训练目的的 TIFF 图像。

于 2013-03-28T23:35:04.877 回答