我对 tessnet2 很陌生。所以我使用 Tessnet2 因为我在 C# 语言中使用 OCR。所以我将 tessnet_32.dll 添加到引用中以使 OCR 工作。但是,我遇到了一个问题。
由于 tessnet2 是 tesseract2.0,我不能使用 tesseract github 中的所有语言文件。因此我的问题是:
1)我是否可以提取 lang.traineddata 并获取所有 8 个可以在 tessnet2 中使用的文件?2)如果没有,谁能解释我如何训练数据以添加新语言?(如韩文或日文)?我知道https://github.com/tesseract-ocr/tesseract/wiki/TrainingTesseract2有所有步骤。但是当我使用命令行时,我什么也得不到。换句话说,我一直在做一个盒子。如果有人可以向我解释如何通过安装 tesseract 2.0 来训练数据,那就太好了。
感谢你们对我的帮助。