8

我想在这张图片上做 OCR。在此处输入图像描述 这是预定义的格式。即前五个将字符,然后接下来的四个将是数字,最后一个将是字符。

当我执行以下命令时

$ tesseract in.png stdout

我得到输出为BDVPD474SQ

所以,我选择了用户模式。我创建了一个名为bazaar的文件(在目录/usr/share/tesseract-ocr/tessdata/configs中) (其内容如下)

load_system_dawg     F
load_freq_dawg       F
user_patterns_suffix user-patterns

我还在目录/usr/share/tesseract-ocr/tessdata中创建了一个名为eng.user-patterns的文件(其内容如下)

\A\A\A\A\A\d\d\d\d\A

不过,我得到了相同的结果

$ tesseract in.png stdout bazaar
BDVPD474SQ

我做错了什么?有没有人通过 Tess4j 做到这一点?

4

0 回答 0