javascript - 将 PDF 页面解析为 javascript 图像

Question

根据标题，有什么方法可以将不受保护的 PDF 文件中的页面解析为 javascript Image() 对象？

在运行 javascript 之前转换它们也可以，但我希望这可以自动完成，并且不需要任何需要安装的库的帮助。

网上有人发布了这个 Bash 脚本。不幸的是，我不了解 Bash，但运行它非常简单。

#!/bin/bash
PDF='doc.pdf'
NUMPAGES=`identify -format %n "$PDF"`

for (( IDX=0; IDX<$NUMPAGES; IDX++ ))
do
  PAGE=$(($IDX+1))
  convert -resize 1200x900 "$PDF[$IDX]" `echo "$PDF" | sed "s/\.pdf$/-page$PAGE.jpg/"`
done

echo "Done"

但我得到了这些错误：

line 3: identify: command not found
line 5: ((: IDX<: syntax error: operand expected (error token is "<")

使用 Bash 脚本预转换 PDF 将是一个很好的解决方案。有人可以修复上面的脚本或提供替代解决方案吗？

提前谢谢了！

score 33 · Accepted Answer

PDF.js将让您将 PDF 呈现到画布上。然后您可以执行以下操作：

var img = new Image();
img.src = pdfCanvas.toDataURL();

PDF.js 给我留下了深刻的印象。我喜欢让客户的浏览器为我做尽可能多的工作。

演示在这里：http: //jsbin.com/pdfjs-helloworld-v2/1/edit

score 1 · Accepted Answer

看起来第一个问题是缺少可执行文件：identify. 这是 ImageMagick 的一部分：

http://www.imagemagick.org/script/index.php

确保你的路径中也有它。

javascript - 将 PDF 页面解析为 javascript 图像

2 回答 2

Related

Reference