我想知道我们将使用什么样的数据来训练 Tesseract OCR 的新语言?
是每个角色吗?或者我们必须做出一些具体的句子?
请帮助提供此信息的一些来源,我无法在其 wiki 页面上清楚地了解。
我想知道我们将使用什么样的数据来训练 Tesseract OCR 的新语言?
是每个角色吗?或者我们必须做出一些具体的句子?
请帮助提供此信息的一些来源,我无法在其 wiki 页面上清楚地了解。
试试这个页面。它告诉你他们为让它识别古希腊而采取的步骤 http://www.eutypon.gr/eutypon/pdf/e2012-29/e29-a01.pdf
这是 tesseract 团队关于训练 tesseract https://code.google.com/p/tesseract-ocr/wiki/TrainingTesseract3的一般信息