0

我在可用命令行的帮助下将 PDF 拆分为页面:

for G in $(seq 1 $(pdfinfo 47.pdf | sed -n 's/Pages:[^0-9]*\([0-9]*\).*/\1/p')) ; do 
   gs \
    -dSAFER \
    -sDEVICE=pdfwrite \
    -dBATCH \
    -dNOPAUSE \
    -dFirstPage=$G \
    -dLastPage=$G \
    -o $G.pdf \
     47.pdf ;
done

但有些页面显示没有文字(图形仍然存在)

因此,我尝试从 PDF 中提取嵌入字体:

gs -q -dNODISPLAY extractFonts.ps -c "(47.pdf) extractFonts quit"

这些字体我已经安装在系统字体文件夹中。

之后,我重复拆分,没有发生任何变化。

如何确保正确提取页面,我现在不知道。

4

1 回答 1

2

Ghostscript 和 pdfwrite 实际上并不是为了分割 PDF 文件,还有其他工具可能会更好,为什么不试试 pdftk 呢?

如果您真的想使用 Ghostscript,那么我建议您从 Git 存储库中获取最新的前沿代码,在该代码中,pdfwrite 设备将接受包含“%d”的输出文件名并将写入一个文件每页。

除此之外,在我看来,您最有可能只是遇到了一个错误,而不是“丢失字体”,如果字体丢失,文本仍然存在,但字体不同。你用的是哪个版本的GS?

于 2012-06-25T09:44:02.237 回答