tesseract - Teeseract (Tess4J ocr java with eclipse)配置

Question

我有一个小问题。我尝试使用 OCR (Tess4J) Tesseract java 和 eclipse 测试一个示例。从图像（扫描文本）中获取文本。

File imageFile = new File("D:\\HEAD2.png");
                Tesseract instance = Tesseract.getInstance();  // JNA Interface Mapping            
               // Tesseract1 instance = new Tesseract1(); // JNA Direct Mapping

                try {
                    String result = instance.doOCR(imageFile);
                    System.out.println(result);
                } catch (TesseractException e) {
                    System.err.println(e.getMessage());
                }

这就是我配置我的应用程序的方式：

1）下载Tess4J包含的文件夹（tess4j.jar、文件夹tessdata、libtesseract302.dll、liblept168.dll）

2）我在应用程序的路径中添加jar 3）我在应用程序的当前目录中添加另一个

最后，该示例运行良好。但是今天，当我执行这个例子时，他提到了我错误

打开数据文件时出错 \Application Data\Tesseract-OCR\tessdata/eng.traineddata 请确保将 TESSDATA_PREFIX 环境变量设置为“tessdata”目录的父目录。加载语言 'eng' 失败 Tesseract 无法加载任何语言！

在C：\ programFiles \ TesseractOCR中下载tesseractOCR.exe之后。它工作正常但是当也删除这个程序也工作正常..waht是这个程序的作用

即使没有它也能正常工作instance.setDatapath("C:\\Program Files\\Tesseract-OCR"); 。我不知道！

score 1 · Accepted Answer

尝试在路径中不使用空格？（应用数据）

你需要磁盘上的库吗？它适用于 Maven 依赖项：

    <dependency>
        <groupId>net.sourceforge.tess4j</groupId>
        <artifactId>tess4j</artifactId>
        <version>3.0.0</version>
    </dependency>
    <dependency>
        <groupId>net.sourceforge.lept4j</groupId>
        <artifactId>lept4j</artifactId>
        <version>1.1.1</version>
    </dependency>

tesseract - Teeseract (Tess4J ocr java with eclipse)配置

1 回答 1

Related

Reference