我们需要以编程方式注释.pdf
文件,然后从该注释中提取文本。用例是用黄色突出显示几个单词,然后不仅获取有关注释的元数据(这已经解决),而且还使该注释中的文本突出显示。
创建注释并获取有关它的元信息的要求不是问题。使用pdf.js
一个函数,该getAnnotations()
函数返回一个 Promise,该 Promise 包含有关 .pdf 中所有注释的信息。
//The data doesn't contain the text information within the annotations using this method in pdf.js
var annotateMeta = page.getAnnotations().then(function (data) {
console.log(data);
});
问题是对象数据具有颜色和坐标信息,但没有关于该注释中文本的任何信息。
有谁知道我们如何使用这些库中的任何一个(或任何其他 .js 库)来获取 .pdf 文件中注释中的文本值?