0

几周前,我们的用户指出一些大型 OCRed PDF(ABBYY 生成)加载速度非常慢,并要求我们对其进行一些优化。

经过一番调查,问题似乎是由 PDF 中嵌入的复杂文本引起的。我尝试了不同的脚本来优化 PDF,例如 ghostscript、qpdf 等...

我发现的唯一一个显着改进是使用带有 -passfonts 选项的 pdftops(来自 poppler)并使用 ghostscript ps2pdf 将其转换回 PDF: pdftops -passfonts intput.pdf output.ps && ps2pdf output.ps output.pdf .

但是,问题是我不知道 -passfonts 如何使 PDF 加载更快,以及它是否会产生我不知道的副作用......

那么 PDF 专家能否阐明这种优化背后的原因/逻辑?

谢谢大家!!杰弗里

4

1 回答 1

0

来自http://linux.die.net/man/1/pdftops

-密码字体

默认情况下,PDF 文件中对非嵌入 8 位字体的引用将替换为最接近的“Helvetica”、“Times-Roman”或“Courier”字体。此选项将对非嵌入字体的引用传递到 PostScript 文件

当文件打开时,阅读器将在系统上查找非嵌入字体,并在找到它们时加载它们。非嵌入式字体越多,它必须进行的检查就越多。有时出于法律原因未嵌入字体,有时由于它们使文件大小不成比例以及其他各种原因而未嵌入字体。通过用更常见的字体替换非嵌入式字体,我会说您正在强制 PDF 加载较少数量的字体,并可能强制 PDF 使用内存占用空间较小的字体,从而加快加载速度时间。

比较前后的字体列表。也许这会带来更多的启示。如果在 Adob​​e Acrobat 中打开文档: 文件 -> 属性 -> 字体

字体替换要小心!它可能会完全破坏文档的外观和感觉。

于 2016-08-04T03:02:28.970 回答