16

我刚刚开始使用 pdf.js,我正在尝试从原始 pdf 数据加载一个 pdf 文件。我看过代码:

PDFJS.getPdf('cwpdf.pdf', function getPdfHelloWorld(data) { 
   ...
}

但我想知道是否有任何方法可以从原始 pdf 数据而不是文件名加载 pdf。这可能吗?

4

2 回答 2

6

我整理了一些完整的代码,并能够通过以下解决方案找到问题:

var int8View = new Uint8Array(...); //populate int8View with the raw pdf data
PDFJS.getDocument(int8View).then(function(pdf) {
}

使用此解决方案时,我遇到了其他用户看到的问题(@MurWade 和@user94154) -stream must have data错误消息。看起来问题出在以下行:

var int8View = new Uint8Array(...);

包含数据的数组未正确创建,因为数据不是预期的格式。因此,这条线适用于某些情况,但可能不适用于一般情况。

我已经整理了一个完整的解决方案,似乎效果更好。它加载一个 PDF 文件,并将其转换为原始 PDF 流。这仅用于测试目的,在现实世界的示例中,PDF 流可能会以不同的方式接收。您可以在调试器中检查流,它将显示为纯文本。下面是使该示例工作的代码的关键行。而是将原始 PDF 流转换为数组,将其转换为数据。

var docInitParams = { data: pdfraw };

然后继续加载数据。下面是如何加载标准原始 PDF 流并显示它的完整工作示例。我曾经以 PDF JS hello world 示例为起点。如果需要对此进行任何澄清,请在评论中告诉我。

'use strict';

PDFJS.getDocument('helloworld.pdf').then(function(pdf) {


  pdf.getData().then(function(arrayBuffer) {
    var pdfraw = String.fromCharCode.apply(null, arrayBuffer);

    var docInitParams = {
      data: pdfraw
    };
    PDFJS.getDocument(docInitParams).then(function(pdfFromRaw) {
      pdfFromRaw.getPage(1).then(function(page) {
        var scale = 1.5;
        var viewport = page.getViewport(scale);

        var canvas = document.getElementById('the-canvas');
        var context = canvas.getContext('2d');
        canvas.height = viewport.height;
        canvas.width = viewport.width;

        var renderContext = {
          canvasContext: context,
          viewport: viewport
        };
        page.render(renderContext);
      });
    });
  });
});

于 2015-08-14T15:11:16.237 回答
2

好吧,由于没有其他人回答,我将发布我的发现。我发现是的,可以从原始数据中加载 pdf 文件。可以做到这一点的方法是使用填充了数据的 UInt8Array 来代替存储 pdf 文件的 url。

执行此操作的示例代码如下:

var int8View = new Uint8Array(...); //populate int8View with the raw pdf data
PDFJS.getDocument(int8View).then(function(pdf) {

}
于 2012-07-26T14:33:54.600 回答