我有一批由扫描页面组成的 PDF(大约 80,000 个文件)。图像层的像素大小与300dpi一致,但似乎设置为72dpi。结果,页面大小显示为 46x35 英寸。我需要调整这些文件,以便将它们注册为 8.5 x 11,或者它们的自然大小,并且我需要能够编写该过程的脚本,以便我可以将其保留在 80,000 个文档上(每个文档 2-5 页。)
我想避免重新采样图像层,因为这可能会增加损失,并显着减慢处理速度。我试过了:
convert -density 300x300 input.pdf output.pdf
但它会重新采样图像。我在 ghostscript 上尝试过不同的变体,例如
gs \
-o output.pdf \
-sDEVICE=pdfwrite \
-dDownsampleMonoImages=false \
-dMonoImageResolution=300 \
input.pdf
这会生成一个文件,但它似乎没有改变,并且仍然注册为超大。此外,页面的大小和方向不同。因此,将它们全部强制为一种尺寸/方向是行不通的。
(仅供参考,我真的不在乎,但下一步是让所有这些文件都有 Acrobat Pro OCR,它的 OCR 会阻塞超过 45 英寸的任何东西。)