我正在试验一个系统来扫描字母并将扫描的位图转换为 PDF,目标是获得高分辨率和较小的 PDF 文件大小。
我正在使用扫描仪、用于位图操作的 GIMP 和用于位图到 PDF 转换的 ImageMagick 进行原型设计。
我的过程如下所示:
以 3x8 位颜色、600 DPI、LZW 压缩的真彩色 TIFF 文件大小进行扫描,大小约为 8 Mb。
使用 GIMP 将位图转换为具有 4 到 8 种颜色的典型颜色表的索引图像。这使得图像可更好地压缩。
使用 ImageMagick 转换 LZW 压缩的索引 TIFF 文件 PDF,每页大约 500K。
现在为了使图像更好地压缩,我可以使位图对压缩更友好。在这里进行实验之前,我想知道 PS/PDF 是如何存储位图的。
PS/PDF 中的位图是运行长度编码的吗?然后我会通过从位图行中删除单个像素来获得压缩。
您有进一步优化的想法吗?
您知道 PS/PDF 中对位图存储格式的引用吗?