我想在这张图片上做 OCR。 这是预定义的格式。即前五个将字符,然后接下来的四个将是数字,最后一个将是字符。
当我执行以下命令时
$ tesseract in.png stdout
我得到输出为BDVPD474SQ
所以,我选择了用户模式。我创建了一个名为bazaar的文件(在目录/usr/share/tesseract-ocr/tessdata/configs中) (其内容如下)
load_system_dawg F
load_freq_dawg F
user_patterns_suffix user-patterns
我还在目录/usr/share/tesseract-ocr/tessdata中创建了一个名为eng.user-patterns的文件(其内容如下)
\A\A\A\A\A\d\d\d\d\A
不过,我得到了相同的结果
$ tesseract in.png stdout bazaar
BDVPD474SQ
我做错了什么?有没有人通过 Tess4j 做到这一点?