16

我目前正在开发一个应用程序,它将Copy/Transfer a sentence/paragraph from a PDF file to my program. 我正在使用 Javascript 开发我的程序,但我不知道如何阅读 PDF 文件。

我想知道如何将 PDF 文件中的句子/段落复制/传输到我的程序?

谢谢。

4

2 回答 2

15

我知道这个问题很老了,但是如果您发现 PDF.js 对于这项工作来说太复杂了,npm install 请 pdfreader。(我写了那个模块)

从 PDF 文件中提取文本需要 5 行代码:

var PdfReader = require("pdfreader").PdfReader;
new PdfReader().parseFileItems("sample.pdf", function(err, item){
  if (item && item.text)
    console.log(item.text);
});
于 2015-03-13T12:27:46.487 回答
7

查看PDF.js,它是一个常用的 JavaScript 库,包含许多用于 PDF 操作的方法。

查看此答案以查看如何使用 pdf.js 提取文本的演示。

于 2015-01-03T14:40:01.677 回答