4

我每个月都有数百万个 Post Script 文件。每个文件每个有 4-5 页。除了第 1 页,每一页的内容都很少。因此,虽然文件中的内容不是太大,但存在不必要的纸张浪费。

我一直在寻找一些工具,可以将第 2 页压缩到最后或修剪未使用的空白区域,以便优化使用纸张。

我得到了具有 PSNUP 命令的 PSUTILS,但它也没有完全满足我的解决方案。

任何有想法的人都可以在这个问题上提供帮助。

我的示例 Post Script 文件可以从

https://www.dropbox.com/s/2z9oirsvxzf13di/1010472622.ps

上面是一个三页的 Post Script 文件。是否可以将第 2 页和第 3 页杵杓以优化纸张使用。

请详细指导

问候'code.box@rediffmail.com

4

1 回答 1

0

这是个有趣的问题。这是部分答案。

要引用类似问题的类似答案,您必须解决两个问题:

  1. 如何确定每个页面的边界框,即包围页面上所有可见标记的最小坐标。
  2. 如何将多个输入页面组合到一个输出页面上。

对于 #1,您可以使用Bounding Box 输出设备Ghostscript。使用如下调用:

gs -dSAFER -dNOPAUSE -dBATCH -sDEVICE=bbox 

和 Ghostscript 打印到标准输出一个边界框,如:

%%BoundingBox: 14 37 570 719
%%HiResBoundingBox: 14.308066 37.547999 569.495061 718.319158

这四个数字是页面上可见内容边界框左上角和右下角的 x,y 坐标。它们以默认 PostScript 语言坐标系表示。

对于#2,以某种方式捕获边界框输出,并使用它来生成修改后的输出文件,其中在每个输出页面上组合了多个输入页面。

如果您的 PostScript 语言文件遵循文档结构约定,您就有机会在 PostScript 语言中执行此操作。如果没有,那么您最好使用 GhostScript 将文件转换为 PDF 语言并在该级别进行组合。

约定的重要属性是每个页面都是独立的,并且文件包含结构化注释,因此您可以检测输入文件中每个页面的开始和结束位置。此外,如果您将不同的输入文件组合成一个输出文件,则输出文件需要包含每个输入文件的所有头文件的所有资源。

您需要编写逐页遍历输入文件的代码。它需要逐页生成输出文件。对于每个输出页面,它需要跟踪到目前为止页面上内容的边界框是什么。

对于每个输入文件,它从步骤 #1 中查找边界框。它将其与输出页面的边界框进行比较。如果输出页面上有输入页面内容的空间,那么: * 生成 PostScript 语言代码保存图形状态,然后将坐标系向下平移到输出页面的空白部分, * 将输入页面内容复制到输出文件,* 生成恢复图形状态的代码

如果没有空间,它会结束当前的输出页面,开始一个新的输出页面,然后执行上述操作。

我不知道有任何现有的、易于使用的工具可以进行这种页面内容拼版。对于熟悉 PostScript 语言和文档结构约定的程序员来说,编写这样一个工具会很简单。这与编写基于 PostScript 语言的页面拼版程序类似。

于 2017-02-04T10:30:24.433 回答