2

我正在尝试制作可以阅读 pdf 的简单移动 UI,但我计划通过使用我自己制作的 pdf 阅读来添加许多功能,而不仅仅是使用 pdf.js 团队制作的查看器,所以我问是否有任何将 pdf 呈现为带有元素的 HTML 的方式,就像他们在查看器上所做的那样,我对画布不满意,任何帮助,提前致谢

4

2 回答 2

3

好吧,伙计们,我终于发现了在 渲染页面时在每个页面上pdf.js调用这些方法的方法getTextContent()

只需获取文档上的每一页

PDFJS.getDocument(url)
  .then(function(pdf) {

    // Get div#container and cache it for later use
    var container = document.getElementById("container");

    // Loop from 1 to total_number_of_pages in PDF document
    for (var i = 1; i <= pdf.numPages; i++) {

        // Get desired page
        pdf.getPage(i).then(function(page) {

          var scale = 1.5;
          var viewport = page.getViewport(scale);
          var div = document.createElement("div");

          // Set id attribute with page-#{pdf_page_number} format
          div.setAttribute("id", "page-" + (page.pageIndex + 1));

          // This will keep positions of child elements as per our needs
          div.setAttribute("style", "position: relative");

          // Append div within div#container
          container.appendChild(div);

          // Create a new Canvas element
          var canvas = document.createElement("canvas");

          // Append Canvas within div#page-#{pdf_page_number}
          div.appendChild(canvas);

          var context = canvas.getContext('2d');
          canvas.height = viewport.height;
          canvas.width = viewport.width;

          var renderContext = {
            canvasContext: context,
            viewport: viewport
          };

          // Render PDF page
          page.render(renderContext);
        });
    }
});

获取每个页面的文本内容 记住它是以前的连续代码然后在里面page.render()添加修改它像这样

// Render PDF page
page.render(renderContext)
  .then(function() {
    // Get text-fragments
    return page.getTextContent();
  })
  .then(function(textContent) {
    // Create div which will hold text-fragments
    var textLayerDiv = document.createElement("div");

    // Set it's class to textLayer which have required CSS styles
    textLayerDiv.setAttribute("class", "textLayer");

    // Append newly created div in `div#page-#{pdf_page_number}`
    div.appendChild(textLayerDiv);

    // Create new instance of TextLayerBuilder class
    var textLayer = new TextLayerBuilder({
      textLayerDiv: textLayerDiv, 
      pageIndex: page.pageIndex,
      viewport: viewport
    });

    // Set text-fragments
    textLayer.setTextContent(textContent);

    // Render text-fragments
    textLayer.render();
  });

有关如何操作的完整教程,请点击此处

于 2020-06-07T15:00:28.187 回答
-2

我不认为有这样的选择。

使用本机支持在浏览器(不是所有移动浏览器)中显示 pdf 文件的唯一方法是将 url 传递给 iframe/embed 标签<iframe src="url_to_your.pdf">

但请注意,这仍然不会导致您正在寻找的 HTML 输出。

于 2020-05-28T14:08:38.437 回答