我正在尝试从 Ubuntu 17.10 中的命令行执行 tesseract。我想要.tsv
文件中的输出,因为我需要置信率。正如这里所解释的,我执行:
tesseract testing_img.png out tsv
但我收到以下错误:
read_params_file: Can't open tsv
Tesseract Open Source OCR Engine v3.05.00 with Leptonica
并且输出正确地写入out.txt
文件中。似乎它将该tsv
参数作为要读取的文件读取,但我不知道为什么。
我已经从源代码编译了 Tesseract,因为我需要 Tesseract 3.05 才能将.tsv
文件作为输出,所以我不能使用 Ubuntu 存储库中的版本,因为它有 Tesseract 3.04。
我正在运行 Ubuntu 17.10。
以下是有关我的 Tesseract 安装的一些信息:
$ tesseract --version
tesseract 3.05.00
leptonica-1.75.3
libpng 1.6.34 : zlib 1.2.11
$ ls /usr/share/tesseract-ocr/tessdata/
configs eng.traineddata ita.traineddata osd.traineddata pdf.ttf tessconfigs
$ echo $TESSDATA_PREFIX
/usr/share/tesseract-ocr/