0

我正在尝试使用 fraktur 字体和 ocropus 来识别德语文本,但它似乎没有使用 deu-f 包。

这是我执行的步骤。

  1. 编译并安装了 tesseract 和 ocropus。
  2. 下载http://tesseract-ocr.googlecode.com/files/tesseract-2.01.deu-f.tar.gz,解压到 tessdata/。

但是当我打电话

 $ ocroscript recognize --tessLanguage=deu-f --output-mode=text image.png

结果和我打电话的时候一样

$ ocroscript recognize --tessLanguage=eng --output-mode=text image.png

任何想法是什么问题?

4

1 回答 1

1

该问题在http://code.google.com/p/ocropus/issues/detail?id=87中有描述。只需要将补丁应用到 ocropus 并重建它。

于 2009-12-08T15:43:17.200 回答