我正在尝试进行培训过程,但我什至不明白如何开始。我想训练阅读它的数字。我的图像来自现实世界,所以阅读过程并不顺利。
它说我必须有一个带有示例的“.tif”图像......是每个数字的单个图像(在这种情况下)还是具有许多不同类型数字的图像(但相同的字体)?
那么makebox呢?该命令在这里不起作用。
https://code.google.com/p/tesseract-ocr/wiki/TrainingTesseract3
有人可以更好地解释我,至少如何开始?
我看到一些软件可以更快地做到这一点,但我尝试了一个(SunnyPage 1.8)但不是免费的。任何人都知道任何免费软件可以做到这一点?还是好的教程?
使用 Tesseract 3、Windows 8(32 位)。