我需要从 Java 应用程序服务器调用 tesseract OCR(它是 C++ 中的一个开源库,用于进行光学字符识别)。现在很容易使用 Runtime.exec() 运行可执行文件。基本逻辑是
- 将当前保存在内存中的图像保存到文件(.tif)
- 将图像文件名传递给 tesseract 命令行程序。
- 使用 FileReader 从 Java 读取输出文本文件。
通过为 Tesseract 编写 JNI 包装器,我可能会在性能方面获得多少改进?不幸的是,没有在 Linux 中工作的开源 JNI 包装器。我必须自己做,并且想知道收益是否值得开发成本。