我正在尝试使用 fraktur 字体和 ocropus 来识别德语文本,但它似乎没有使用 deu-f 包。
这是我执行的步骤。
- 编译并安装了 tesseract 和 ocropus。
- 下载http://tesseract-ocr.googlecode.com/files/tesseract-2.01.deu-f.tar.gz,解压到 tessdata/。
但是当我打电话
$ ocroscript recognize --tessLanguage=deu-f --output-mode=text image.png
结果和我打电话的时候一样
$ ocroscript recognize --tessLanguage=eng --output-mode=text image.png
任何想法是什么问题?