我在我的 Mac 上使用最新版本的 Tesseract。我在一个文件夹中有一个 eng.traineddata,在另一个文件夹中有一个 eng.traineddata。我希望将我的训练数据文件组合成一个大的训练字体文件。
谁能告诉我该怎么做?我在某处读到 -l 命令可能是我需要的。
谢谢!
Tesseract 不会在两个不同的文件夹中查找语言数据。您可以做的是将其中一个重命名,例如,改名为eng1.traineddata
,然后将它们指定为命令的-l eng+eng1
选项tesseract
。
i also tried for that but it seems possible only if we are creating traineddata file by compiling multiple images at the same time . here is detailed procedure ....
"https://printalert.wordpress.com/2014/10/28/tesseract-training-more-fonts/"