18

根据标题,有什么方法可以将不受保护的 PDF 文件中的页面解析为 javascript Image() 对象?

在运行 javascript 之前转换它们也可以,但我希望这可以自动完成,并且不需要任何需要安装的库的帮助。

网上有人发布了这个 Bash 脚本。不幸的是,我不了解 Bash,但运行它非常简单。

#!/bin/bash
PDF='doc.pdf'
NUMPAGES=`identify -format %n "$PDF"`

for (( IDX=0; IDX<$NUMPAGES; IDX++ ))
do
  PAGE=$(($IDX+1))
  convert -resize 1200x900 "$PDF[$IDX]" `echo "$PDF" | sed "s/\.pdf$/-page$PAGE.jpg/"`
done

echo "Done"

但我得到了这些错误:

line 3: identify: command not found
line 5: ((: IDX<: syntax error: operand expected (error token is "<")

使用 Bash 脚本预转换 PDF 将是一个很好的解决方案。有人可以修复上面的脚本或提供替代解决方案吗?

提前谢谢了!

4

2 回答 2

33

PDF.js将让您将 PDF 呈现到画布上。然后您可以执行以下操作:

var img = new Image();
img.src = pdfCanvas.toDataURL();

PDF.js 给我留下了深刻的印象。我喜欢让客户的浏览器为我做尽可能多的工作。

演示在这里:http: //jsbin.com/pdfjs-helloworld-v2/1/edit

于 2012-10-16T18:38:51.797 回答
1

看起来第一个问题是缺少可执行文件:identify. 这是 ImageMagick 的一部分:

http://www.imagemagick.org/script/index.php

确保你的路径中也有它。

于 2012-10-16T18:27:55.017 回答