0

我在设置字体属性文件以训练 tesseract v 3.01 ocr 引擎时遇到了问题。根据 3.01v,您需要设置字体属性文件。font_properties 文件的格式是这样的

并且必须使用 0 或 1 个标志来指示属性。有谁知道fixed、serif或fraktur是什么意思?

当我使用我的 font_properties 文件运行它时,它会引发以下错误在此处输入图像描述]![在此处输入图像描述

谢谢

4

3 回答 3

1

固定(或等宽)、Serif 和 Fraktur 是标准字体描述符 - 您可以在 Wikipedia 上查找它们的含义。

关于您的错误,请确保您已正确格式化您的 font_properties 文件,如下面的 Training Tesseract 3 教程中所述。如果您只训练一种字体,则文件应包含一行,在您的情况下

times_new_roman 0 0 0 1 0

您还没有包含您在 font_properties 文件中放入的内容,但请注意您的字体名称不应包含空格!

http://code.google.com/p/tesseract-ocr/wiki/TrainingTesseract3

于 2012-07-24T13:04:05.847 回答
1

Tesseract 训练的输入文件不应在其名称中包含空格。

font_properties 中的条目应与图像文件名称的 fontname 部分匹配;例如,如果 font_properties 有 uknumberplate,那么图像的文件名应该是 eng.uknumberplate.exp0.tif。

于 2012-07-25T00:08:07.927 回答
0

您必须将 font_properties.txt 放入命令中,但随后会在 windows 中引发异常,但它会找到字体属性文件。

于 2015-03-28T15:02:52.780 回答