在 Web 上找到的大多数 PDF 文件都有压缩且不可读的数据流。是否可以使用 Acrobat 或 Acrobat Distiller 解压缩 PDF 文件的内部内容,让我们可以通过文本编辑器读取源代码?
PS 这个问题的灵感来自这个答案,它解释了如何使用 GhostScript 来完成。
qpdf
并且pdftk
已经被提及。要显示命令:
$ qpdf --qdf --object-streams=disable orig.pdf uncompressed-orig.pdf
$ pdftk orig.pdf output uncompressed-orig.pdf uncompress
mutool然而还没有被提及:
$ mutool clean -d -a orig.pdf uncompressed-orig.pdf
mutool
是一个命令行工具,与轻量级 MuPDF PDF + 文档查看器一起提供。
我认为您无法使用 Acrobat 或 Distiller 解压缩 PDF 对象的流(除非您有其他可用的付费软件插件)。
使用cpdf:
cpdf -decompress in.pdf -o out.pdf
然后可以在文本编辑器中读取每个页面的图形运算符。不过,您需要一份标准副本作为参考。
披露:我是 cpdf 的作者。