image-processing - 无法正确设置 tesseract

翻译自：https://stackoverflow.com/questions/37979184 2016-06-22T22:18:06.493

133 次

我正在尝试在此图像上使用 tesseract：

当我使用默认配置时：

tesseract image.jpg stdout

它返回\KD FWOW。
如您所见，唯一的错误是第一个字母L被识别为反斜杠

因此，我/usr/share/tesseract-ocr/tessdata/configs使用以下设置创建了一个配置文件：

tessedit_char_whitelist ABCDEFGHIJKLMNOPQRSTUWXYZ

目标是只识别字母，而不是特殊字符。但是，当我使用此配置运行 tesseract 时：

tesseract image.jpg stdout letters

结果是XKD FVOIV，现在它缺少一个以上的字符，主要是 'W'。

这对我来说毫无意义，我不明白为什么它在白名单上时停止识别 W。当然，我在配置中遗漏了一些东西。

我该如何解决？

0 回答 0