ocr - 在 Linux 上使用 OCRopus/Tesseract 进行 Fraktur 识别

Question

我正在尝试使用 fraktur 字体和 ocropus 来识别德语文本，但它似乎没有使用 deu-f 包。

这是我执行的步骤。

编译并安装了 tesseract 和 ocropus。
下载http://tesseract-ocr.googlecode.com/files/tesseract-2.01.deu-f.tar.gz，解压到 tessdata/。

但是当我打电话

 $ ocroscript recognize --tessLanguage=deu-f --output-mode=text image.png

结果和我打电话的时候一样

$ ocroscript recognize --tessLanguage=eng --output-mode=text image.png

任何想法是什么问题？

score 1 · Accepted Answer

该问题在http://code.google.com/p/ocropus/issues/detail?id=87中有描述。只需要将补丁应用到 ocropus 并重建它。

1 回答 1