2

我正在尝试让 gocr 识别 png 中的文本。我使用以下命令运行 gocr:

gocr -p ../db/ -m 386 output-4.png

-m 386 选项关闭识别引擎,并根据手册页扩展数据库(提示用户输入未识别的字符并用用户回答扩展数据库)。

gocr 提示我输入它无法识别的字符,然后我告诉它这些字符是什么 - 然后它会从 png 中生成一个完美(足够接近)的文档。

所以我重新运行 gocr 使用:

gocr -p ../db/ -m 258 output-4.png

这里 -m 258 选项关闭字符识别算法并告诉 gocr 匹配数据库中的字符。但是现在它输出了很多无法识别的字符。它不应该产生与我在训练数据库后获得的相同输出吗?

我可以使用算法打开匹配(然后在找不到匹配项时让 gocr 匹配数据库中的字符)但是它会引入很多错误,例如将“9”识别为“g”或“0”如“o”等。

有谁知道我做错了什么?

4

1 回答 1

1

您可以使用 -a 100 标志来训练 gocr,这应该会询问您更多字符。这对我有用。所以:

gocr -p ../db/ -m 386 -a 100 output-4.png
于 2012-08-06T00:52:42.713 回答