3


在运行 unicharset_extractor 之后,我已经成功地创建了一个带有 tesseract 的盒子文件,
它创建了如下所示的 unicharset 文件:

...
n 3 NULL -1
s 3 NULL 23
t 3 NULL 43
...

我继续执行此命令

mftraining -U unicharset -O testlang.unicharset testlang.tr

只是为了得到下一个错误

Reading testlang.tr ...
testlang has no defined properties.

Error: Illegal short name for a feature!
4

1 回答 1

0

我从未使用过 Tesseract,但似乎错误数据库中有一个未解决的问题,看起来很像您的问题:http ://code.google.com/p/tesseract-ocr/issues/detail?id= 385

似乎与某些功能没有正确支持科学计数法有关。

在问题页面上,一个用户提出了一个解决方案,另一个人提出了一个补丁。您可以尝试应用补丁,看看是否有帮助。

于 2011-03-01T20:06:27.440 回答