5

我们需要以编程方式注释.pdf文件,然后从该注释中提取文本。用例是用黄色突出显示几个单词,然后不仅获取有关注释的元数据(这已经解决),而且使该注释中的文本突出显示。

创建注释并获取有关它的元信息的要求不是问题。使用pdf.js一个函数,该getAnnotations()函数返回一个 Promise,该 Promise 包含有关 .pdf 中所有注释的信息。

//The data doesn't contain the text information within the annotations using this method in pdf.js
var annotateMeta = page.getAnnotations().then(function (data) {
  console.log(data);
});

问题是对象数据具有颜色和坐标信息,但没有关于该注释中文本的任何信息。

有谁知道我们如何使用这些库中的任何一个(或任何其他 .js 库)来获取 .pdf 文件中注释中的文本值?

4

0 回答 0