我有一个小问题。我尝试使用 OCR (Tess4J) Tesseract java 和 eclipse 测试一个示例。从图像(扫描文本)中获取文本。
File imageFile = new File("D:\\HEAD2.png");
Tesseract instance = Tesseract.getInstance(); // JNA Interface Mapping
// Tesseract1 instance = new Tesseract1(); // JNA Direct Mapping
try {
String result = instance.doOCR(imageFile);
System.out.println(result);
} catch (TesseractException e) {
System.err.println(e.getMessage());
}
这就是我配置我的应用程序的方式:
1)下载Tess4J包含的文件夹(tess4j.jar、文件夹tessdata、libtesseract302.dll、liblept168.dll)
2)我在应用程序的路径中添加jar 3)我在应用程序的当前目录中添加另一个
最后,该示例运行良好。但是今天,当我执行这个例子时,他提到了我错误
打开数据文件时出错 \Application Data\Tesseract-OCR\tessdata/eng.traineddata 请确保将 TESSDATA_PREFIX 环境变量设置为“tessdata”目录的父目录。加载语言 'eng' 失败 Tesseract 无法加载任何语言!
在C:\ programFiles \ TesseractOCR中下载tesseractOCR.exe之后。它工作正常但是当也删除这个程序也工作正常..waht是这个程序的作用
即使没有它也能正常工作instance.setDatapath("C:\\Program Files\\Tesseract-OCR");
。我不知道!