我正在使用 Tesseract,我想开发一个能够识别一系列字符的应用程序。我取得了不错的成绩,但并不出色。
我想阅读的字符序列总是有一个特定的模式,比如说:
number number number number char char - (eg: 123AB)
有没有办法“告诉” ocr 引擎结构始终是固定的,以提高识别结果?
先感谢您。
我正在使用 Tesseract,我想开发一个能够识别一系列字符的应用程序。我取得了不错的成绩,但并不出色。
我想阅读的字符序列总是有一个特定的模式,比如说:
number number number number char char - (eg: 123AB)
有没有办法“告诉” ocr 引擎结构始终是固定的,以提高识别结果?
先感谢您。
在 Tesseract 中尝试集市匹配模式:
\d\d\d\c\c
您可以使用“tessedit_char_whitelist”参数