Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
我在 Windows 7 64 位上使用 tesseract 3.0.1。
培训文档说:
每种字体都应放在一个多页 tiff 中(仅当您使用 libtiff 时!)
我不熟悉libtiff。我使用 ImageMagick 创建多页 tiff。到目前为止,这运作良好,或者至少看起来如此。我以后会遇到一些障碍吗?如果是这样,如何处理 libtiff - 运行它的设置是否足够或者我需要配置一些东西?
Tesseract 并不关心您如何生成多页 tiff,只要它可以使用 leptonica 读取它(内部依赖于 libtiff)。如果 tesseract 现在可以处理您的 tiff,那么它可以在其余的训练过程中执行相同的操作以及运行 OCR,所以您可以开始了。我已经用 .Net 标准库制作了我的多页 tiff,而 tesseract 没有问题。