8

我正在将内存中的文档转换为 pdf (unoconv) 并在终端中打印 (pdftotext):

unoconv -f pdf --stdout sample.doc | pdftotext -layout -enc UTF-8 - out.txt

正在工作中。现在我想使用这个命令child_process.spawn

let filePath = "...",
process = child_process.spawn("unoconv", [
  "-f",
  "pdf",
  "--stdout",
  filePath,
  "|",
  "pdftotext",
  "-layout",
  "-enc",
  "UTF-8",
  "-",
  "-"
]);

在这种情况下,只有第一个命令(| 之前)有效。我可以做我正在尝试的事情吗?

谢谢。

更新-

的结果:sh -c- ....

bash-3.2$ sh -c- unoconv -f pdf --stdout /Users/fatimaalves/DEV/xx/_input/sample.doc | pdftotext -layout -enc UTF-8 - -
sh: --: invalid option
Usage:  sh [GNU long option] [option] ...
    sh [GNU long option] [option] script-file ...
GNU long options:
    --debug
    --debugger
    --dump-po-strings
    --dump-strings
    --help
    --init-file
    --login
    --noediting
    --noprofile
    --norc
    --posix
    --protected
    --rcfile
    --restricted
    --verbose
    --version
    --wordexp
Shell options:
    -irsD or -c command or -O shopt_option      (invocation only)
    -abefhkmnptuvxBCHP or -o option
Syntax Warning: May not be a PDF file (continuing anyway)
Syntax Error: Couldn't find trailer dictionary
Syntax Error: Couldn't find trailer dictionary
Syntax Error: Couldn't read xref table
4

2 回答 2

11

以管道开头的所有内容都不是unoconv. 它由 shell 处理,而不是由unoconv. 所以你不能将它作为参数数组的一部分传递给unoconv.

有很多方法可以解决这个问题,具体取决于您的需要。如果您知道您将只在类 UNIX 操作系统上运行,您可以将您的命令作为参数传递给sh

process = child_process.spawn('sh', ['-c', 'unoconv -f pdf --stdout sample.doc | pdftotext -layout -enc UTF-8 - out.txt']);
于 2016-07-08T18:47:21.253 回答
7

如果您不想使用上述sh命令,则必须创建多个 child_process.spawn 实例,然后将它们彼此通过管道传输,如下所示:

const getModule = spawn('curl', [url, '-ks']);
const unTar = spawn('tar', ['-xvz', '-C', fileName, '--strip-components', 1]);
getModule.stdout.pipe(unTar.stdin);

上面的代码理论上会从 中检索一个 tarurl文件,然后解压到一个目录中fileName

于 2018-10-04T14:33:16.667 回答