这是个有趣的问题。这是部分答案。
要引用类似问题的类似答案,您必须解决两个问题:
- 如何确定每个页面的边界框,即包围页面上所有可见标记的最小坐标。
- 如何将多个输入页面组合到一个输出页面上。
对于 #1,您可以使用Bounding Box 输出设备到Ghostscript。使用如下调用:
gs -dSAFER -dNOPAUSE -dBATCH -sDEVICE=bbox
和 Ghostscript 打印到标准输出一个边界框,如:
%%BoundingBox: 14 37 570 719
%%HiResBoundingBox: 14.308066 37.547999 569.495061 718.319158
这四个数字是页面上可见内容边界框左上角和右下角的 x,y 坐标。它们以默认 PostScript 语言坐标系表示。
对于#2,以某种方式捕获边界框输出,并使用它来生成修改后的输出文件,其中在每个输出页面上组合了多个输入页面。
如果您的 PostScript 语言文件遵循文档结构约定,您就有机会在 PostScript 语言中执行此操作。如果没有,那么您最好使用 GhostScript 将文件转换为 PDF 语言并在该级别进行组合。
约定的重要属性是每个页面都是独立的,并且文件包含结构化注释,因此您可以检测输入文件中每个页面的开始和结束位置。此外,如果您将不同的输入文件组合成一个输出文件,则输出文件需要包含每个输入文件的所有头文件的所有资源。
您需要编写逐页遍历输入文件的代码。它需要逐页生成输出文件。对于每个输出页面,它需要跟踪到目前为止页面上内容的边界框是什么。
对于每个输入文件,它从步骤 #1 中查找边界框。它将其与输出页面的边界框进行比较。如果输出页面上有输入页面内容的空间,那么: * 生成 PostScript 语言代码保存图形状态,然后将坐标系向下平移到输出页面的空白部分, * 将输入页面内容复制到输出文件,* 生成恢复图形状态的代码
如果没有空间,它会结束当前的输出页面,开始一个新的输出页面,然后执行上述操作。
我不知道有任何现有的、易于使用的工具可以进行这种页面内容拼版。对于熟悉 PostScript 语言和文档结构约定的程序员来说,编写这样一个工具会很简单。这与编写基于 PostScript 语言的页面拼版程序类似。