21

在 Web 上找到的大多数 PDF 文件都有压缩且不可读的数据流。是否可以使用 Acrobat 或 Acrobat Distiller 解压缩 PDF 文件的内部内容,让我们可以通过文本编辑器读取源代码?

PS 这个问题的灵感来自这个答案,它解释了如何使用 GhostScript 来完成。

4

3 回答 3

25

qpdf并且pdftk已经被提及。要显示命令:

$ qpdf --qdf --object-streams=disable orig.pdf uncompressed-orig.pdf
$ pdftk orig.pdf output uncompressed-orig.pdf uncompress

mutool然而还没有被提及:

$ mutool clean -d -a orig.pdf uncompressed-orig.pdf

mutool是一个命令行工具,与轻量级 MuPDF PDF + 文档查看器一起提供。

我认为您无法使用 Acrobat 或 Distiller 解压缩 PDF 对象的流(除非您有其他可用的付费软件插件)。

于 2015-05-07T16:32:59.487 回答
18

使用cpdf

cpdf -decompress in.pdf -o out.pdf

然后可以在文本编辑器中读取每个页面的图形运算符。不过,您需要一份标准副本作为参考。

披露:我是 cpdf 的作者。

于 2013-09-16T10:34:47.610 回答
7

这很容易使用qpdfpdftk

使用 Adob​​e Acrobat,您可以在分析 PDF 后获得内部结构(使用一些配置文件进行预检(例如检测 PDF 语法错误),然后是选项-> 内部 PDF 结构) - 但无法使用文本编辑器获得可编辑的内容。

于 2013-09-15T21:05:54.937 回答