3

我正在尝试从 Ubuntu 17.10 中的命令行执行 tesseract。我想要.tsv文件中的输出,因为我需要置信率。正如这里所解释的,我执行:

tesseract testing_img.png out tsv

但我收到以下错误:

read_params_file: Can't open tsv
Tesseract Open Source OCR Engine v3.05.00 with Leptonica

并且输出正确地写入out.txt文件中。似乎它将该tsv参数作为要读取的文件读取,但我不知道为什么。

我已经从源代码编译了 Tesseract,因为我需要 Tesseract 3.05 才能将.tsv文件作为输出,所以我不能使用 Ubuntu 存储库中的版本,因为它有 Tesseract 3.04。

我正在运行 Ubuntu 17.10。

以下是有关我的 Tesseract 安装的一些信息:

$ tesseract --version
    tesseract 3.05.00
     leptonica-1.75.3
      libpng 1.6.34 : zlib 1.2.11

$ ls /usr/share/tesseract-ocr/tessdata/
    configs  eng.traineddata  ita.traineddata  osd.traineddata  pdf.ttf  tessconfigs

$ echo $TESSDATA_PREFIX
    /usr/share/tesseract-ocr/
4

1 回答 1

4

我有同样的问题,在我的情况下,目录中调用tsv了一个文件

/usr/share/tesseract-ocr/tessdata/configs

不见了。我从以下位置下载了 tesseract 的源代码:

https://github.com/tesseract-ocr/tesseract/archive/3.05.00.tar.gz

并替换了文件夹的内容configs

于 2018-04-24T19:29:14.863 回答