我在设置字体属性文件以训练 tesseract v 3.01 ocr 引擎时遇到了问题。根据 3.01v,您需要设置字体属性文件。font_properties 文件的格式是这样的
并且必须使用 0 或 1 个标志来指示属性。有谁知道fixed、serif或fraktur是什么意思?
当我使用我的 font_properties 文件运行它时,它会引发以下错误
谢谢
我在设置字体属性文件以训练 tesseract v 3.01 ocr 引擎时遇到了问题。根据 3.01v,您需要设置字体属性文件。font_properties 文件的格式是这样的
并且必须使用 0 或 1 个标志来指示属性。有谁知道fixed、serif或fraktur是什么意思?
当我使用我的 font_properties 文件运行它时,它会引发以下错误
谢谢
固定(或等宽)、Serif 和 Fraktur 是标准字体描述符 - 您可以在 Wikipedia 上查找它们的含义。
关于您的错误,请确保您已正确格式化您的 font_properties 文件,如下面的 Training Tesseract 3 教程中所述。如果您只训练一种字体,则文件应包含一行,在您的情况下
times_new_roman 0 0 0 1 0
您还没有包含您在 font_properties 文件中放入的内容,但请注意您的字体名称不应包含空格!
http://code.google.com/p/tesseract-ocr/wiki/TrainingTesseract3
Tesseract 训练的输入文件不应在其名称中包含空格。
font_properties 中的条目应与图像文件名称的 fontname 部分匹配;例如,如果 font_properties 有 uknumberplate,那么图像的文件名应该是 eng.uknumberplate.exp0.tif。
您必须将 font_properties.txt 放入命令中,但随后会在 windows 中引发异常,但它会找到字体属性文件。