ocr - 未应用 Tesseract 用户模式

翻译自：https://stackoverflow.com/questions/33429143 2015-10-30T05:18:33.283

2227 次

我想在这张图片上做 OCR。这是预定义的格式。即前五个将字符，然后接下来的四个将是数字，最后一个将是字符。

当我执行以下命令时

$ tesseract in.png stdout

我得到输出为BDVPD474SQ

所以，我选择了用户模式。我创建了一个名为bazaar的文件（在目录/usr/share/tesseract-ocr/tessdata/configs中）（其内容如下）

load_system_dawg     F
load_freq_dawg       F
user_patterns_suffix user-patterns

我还在目录/usr/share/tesseract-ocr/tessdata中创建了一个名为eng.user-patterns的文件（其内容如下）

\A\A\A\A\A\d\d\d\d\A

不过，我得到了相同的结果

$ tesseract in.png stdout bazaar
BDVPD474SQ

我做错了什么？有没有人通过 Tess4j 做到这一点？

0 回答 0