据我所知,Tesseract 3.x 带有 6 种英文(如果我错了,请纠正我)字体。我需要为更多 5 种字体训练 Tesseract。我只需要大写字母和数字(没有特殊字符或符号)。
我遵循了各种流程,例如: 向 Tesseract 3 OCR 引擎添加新字体
并且还使用了诸如Serak Tesseract Trainer for Tesseract 3.02之类的工具来自动化该过程
为了生成盒子文件,我使用了 QT Box Editor
使用上述工具后,我得到eng.traineddata
文件。所有教程都告诉我将此eng.traineddata
文件添加到文件Tesseract-OCR\tessdata
夹中,但这样做会替换原始eng.traineddata
文件。这样做之后,我会丢失 Tesseract 3.x 附带的默认字体吗?
如何添加新字体?我还不清楚。我希望有人可以在这里帮助我。谢谢。