3

我有一个小问题。我尝试使用 OCR (Tess4J) Tesseract java 和 eclipse 测试一个示例。从图像(扫描文本)中获取文本。

File imageFile = new File("D:\\HEAD2.png");
                Tesseract instance = Tesseract.getInstance();  // JNA Interface Mapping            
               // Tesseract1 instance = new Tesseract1(); // JNA Direct Mapping

                try {
                    String result = instance.doOCR(imageFile);
                    System.out.println(result);
                } catch (TesseractException e) {
                    System.err.println(e.getMessage());
                }

这就是我配置我的应用程序的方式:

1)下载Tess4J包含的文件夹(tess4j.jar、文件夹tessdata、libtesseract302.dll、liblept168.dll)

2)我在应用程序的路径中添加jar 3)我在应用程序的当前目录中添加另一个

最后,该示例运行良好。但是今天,当我执行这个例子时,他提到了我错误

打开数据文件时出错 \Application Data\Tesseract-OCR\tessdata/eng.traineddata 请确保将 TESSDATA_PREFIX 环境变量设置为“tessdata”目录的父目录。加载语言 'eng' 失败 Tesseract 无法加载任何语言!

在C:\ programFiles \ TesseractOCR中下载tesseractOCR.exe之后。它工作正常但是当也删除这个程序也工作正常..waht是这个程序的作用

即使没有它也能正常工作instance.setDatapath("C:\\Program Files\\Tesseract-OCR"); 。我不知道!

4

1 回答 1

1

尝试在路径中不使用空格?(应用数据)

你需要磁盘上的库吗?它适用于 Maven 依赖项:

    <dependency>
        <groupId>net.sourceforge.tess4j</groupId>
        <artifactId>tess4j</artifactId>
        <version>3.0.0</version>
    </dependency>
    <dependency>
        <groupId>net.sourceforge.lept4j</groupId>
        <artifactId>lept4j</artifactId>
        <version>1.1.1</version>
    </dependency>
于 2016-03-08T18:58:03.147 回答