我为网页使用了 2 种字体,并使用 wkhtmltopdf 将网页打印为 pdf。在 pdf 文件中嵌入了 3 种字体。我将整个文本从 acrobat reader 复制到 libre office writer。在 libre office 中只显示了我的 2 种字体。
如何识别用于 pdf 文件中特定文本块的字体?
如何从 pdf 文件中提取具有特定字体的文本?如何在 pdf 文件中使用特定字体为文本添加红色墨水?
这是三个问题。
最简单的解决方案:打开 Firefox,about:config 以您的方式进行pdfjs.bdfBugEnabled
设置并将其设置为true
. 然后在 Firefox 中打开您的 pdf 文件并选择您关心的文本。右侧的调试面板将立即显示您选择的文本应用了哪些字体。
像其他任何地方一样复制粘贴,或使用 pdf 应用程序导出为纯文本。
我不知道你在这里问什么。如果您想编辑 PDF(我认为这是您所要求的),则 PDF 需要以允许这样做的方式构建。如果有:使用 Acrobat 之类的 PDF 编辑器来完成您需要做的事情。如果没有:你不能。