15

我一直在尝试编写一个 java 程序,该程序使用该Runtime.getRuntime().exec()方法使用命令行来运行程序“tesseract”的实例。

一些背景知识,Tesseract 是一个免费的开源程序,用于对图片执行 OCR(光学字符识别)。它接收一个图片文件并输出一个文本文件。它是一个命令行程序,使用此命令运行

(从命令提示符外壳中)

tesseract imageFilePath outFilePath [optional arguments] 

例子:

tesseract "C:\Program Files (x86)\Tesseract-OCR\doc\eurotext.tif" "C:\Users\Dreadnought\Documents\TestingFolder\out"

第一个参数调用 tesseract 程序,第二个是图像文件的绝对路径,最后一个参数是输出文件的路径和名称。Tesseract 只需要输出文件的名称,不需要扩展名。

在命令提示符下工作,这很完美。但是,我想从 java 程序中运行它并且遇到了一些错误。

我发现此代码作为起点非常有用

public class Main
{
   public static void main(String args[])
   {
      try
      {
         Runtime rt = Runtime.getRuntime();
         String cmdString = "cmd /c dir";

         System.out.println(cmdString);
         Process pr = rt.exec(cmdString);

         BufferedReader input = new BufferedReader(new InputStreamReader(
                                                   pr.getInputStream()));

         String line = null;

         while ((line = input.readLine()) != null)
         {
            System.out.println(line);
         }

         int exitVal = pr.waitFor();
         System.out.println("Exited with error code " + exitVal);

      }
      catch (Exception e)
      {
         System.out.println(e.toString());
         e.printStackTrace();
      }
   }
}

它打印出 dir 命令的结果。但是,当我像这样修改它时

public class Main
{
   public static void main(String args[])
   {
      try
      {
         Runtime rt = Runtime.getRuntime();
         String imageFilePath = "\"C:\\Program Files (x86)\\Tesseract-OCR\\doc\\eurotext.tif\"";
         String outputFilePath = "\"C:\\Users\\Dreadnought\\Documents\\TestingFolder\\eurotext-example\"";
         String[] commands = {"cmd", "/c", "tesseract", imageFilePath, outputFilePath };

         Process pr = rt.exec(commands);

         BufferedReader input = new BufferedReader(new InputStreamReader(
               pr.getInputStream()));

         String line = null;

         while ((line = input.readLine()) != null)
         {
            System.out.println(line);
         }

         int exitVal = pr.waitFor();
         System.out.println("Exited with error code " + exitVal);
      }
      catch (Exception e)
      {
         System.out.println(e.toString());
         e.printStackTrace();
      }
   }
}

它唯一输出的是Exited with error code 1. 如果进程以错误结束,这是预期的输出。

我什至尝试过"cmd /c tesseract \"C:\\Program Files (x86)\\Tesseract-OCR\\doc\\eurotext.tif\" \"C:\\Users\\Dreadnought\\Documents\\TestingFolder\\eurotext-example\"",但我最终遇到了同样的错误。

根据在 getRuntime().exec 中使用引号,我认为问题在于我试图转义引号,所以这就是我传入字符串数组的原因。但我仍然得到Exited with error code 1.

是否可以使用 java 命令执行命令行程序Runtime.getRuntime().exec()


编辑:问题仍然存在

我尝试不使用 Evgeniy Dorofeev 和 Nandkumar Tekale 在下面建议的推理方式使用“cmd /c”。但是,我得到了另一种错误:

java.io.IOException: Cannot run program "tesseract": CreateProcess error=2, The system cannot find the file specified
java.io.IOException: Cannot run program "tesseract": CreateProcess error=2, The system  cannot find the file specified
    at java.lang.ProcessBuilder.start(Unknown Source)
    at java.lang.Runtime.exec(Unknown Source)
    at java.lang.Runtime.exec(Unknown Source)
    at Main.main(Main.java:15)
Caused by: java.io.IOException: CreateProcess error=2, The system cannot find the file specified
    at java.lang.ProcessImpl.create(Native Method)
    at java.lang.ProcessImpl.<init>(Unknown Source)
    at java.lang.ProcessImpl.start(Unknown Source)
... 4 more

也许这提供了更多信息?我真的很好奇是什么导致了这个问题。无论我是否将转义引号添加到我的论点中,问题都是相同的。


编辑 2:一时兴起,我提供了 tesseract 可执行文件的绝对路径,而不是cmd /c像魅力一样使用工作。我猜问题是Runtime.getRuntime().exec()不能调用环境变量?

4

4 回答 4

4

您没有捕获 STDERR,因此当发生错误时,您不会从 STDOUT(您正在捕获的)接收它们。尝试:

BufferedReader input = new BufferedReader(new InputStreamReader(
               pr.getErrorStream()));
于 2016-10-07T21:53:18.037 回答
3

好吧tesseract是外部命令,因此您不需要将其与cmd. 添加tesseract到环境变量。使用直接命令:

String[] commands = {"tesseract", imageFilePath, outputFilePath };

存在状态 1 表示功能不正确。查看进程退出状态

于 2012-11-20T05:53:21.940 回答
1

另一种解决方法是提供文件的完整安装路径,例如 /usr/local/Cellar/tesseract/3.02.02/bin/tesseract"

于 2013-06-14T21:52:16.063 回答
1

另一种无需重新编译和部署的解决方法是使用旧的 DOS 样式路径,例如C:\Program Files. C:\Progra~1当然,仅当您从配置文件或数据库和注册表等读取路径时,这才会有帮助。

于 2013-05-02T15:23:46.190 回答