1

我在 Windows 7 64 位上使用 tesseract 3.0.1。

培训文档说:

每种字体都应放在一个多页 tiff 中(仅当您使用 libtiff 时!

我不熟悉libtiff。我使用 ImageMagick 创建多页 tiff。到目前为止,这运作良好,或者至少看起来如此。我以后会遇到一些障碍吗?如果是这样,如何处理 libtiff - 运行它的设置是否足够或者我需要配置一些东西?

4

1 回答 1

1

Tesseract 并不关心您如何生成多页 tiff,只要它可以使用 leptonica 读取它(内部依赖于 libtiff)。如果 tesseract 现在可以处理您的 tiff,那么它可以在其余的训练过程中执行相同的操作以及运行 OCR,所以您可以开始了。我已经用 .Net 标准库制作了我的多页 tiff,而 tesseract 没有问题。

于 2012-05-28T07:54:10.153 回答