我在可用命令行的帮助下将 PDF 拆分为页面:
for G in $(seq 1 $(pdfinfo 47.pdf | sed -n 's/Pages:[^0-9]*\([0-9]*\).*/\1/p')) ; do
gs \
-dSAFER \
-sDEVICE=pdfwrite \
-dBATCH \
-dNOPAUSE \
-dFirstPage=$G \
-dLastPage=$G \
-o $G.pdf \
47.pdf ;
done
但有些页面显示没有文字(图形仍然存在)
因此,我尝试从 PDF 中提取嵌入字体:
gs -q -dNODISPLAY extractFonts.ps -c "(47.pdf) extractFonts quit"
这些字体我已经安装在系统字体文件夹中。
之后,我重复拆分,没有发生任何变化。
如何确保正确提取页面,我现在不知道。