0

我是 Python 新手,正在尝试掌握现有脚本。此示例来自 pdfrw,如下所示:http ://code.google.com/p/pdfrw/wiki/ExampleTools

“带有精美打印机和/或 Acrobat 完整副本的打印机可以轻松地将您的小型 PDF 转换为小册子(例如,在单个 11" x 17" 上打印 4 个字母大小的页面)。

但这假设有几件事,包括人员知道如何操作硬件和软件。booklet.py 可让您将 PDF 转换为预先格式化的小册子,以减少他们搞砸的机会:"

尽我所能告诉的步骤是:

  • 该函数开始循环浏览页面
  • 声明了一个变量“shift_right” ??? (我认为它是用于元数据的?)
  • 声明了一个仅对元数据有用的变量“stuff”(我认为)
  • x 增加 BBox 列表的第三个索引(这个列表是什么,它是什么时候建立的?)
  • y 分配给 y 和 Bbox 列表的第三个索引之间的较大值(同样,这个列表指的是什么?)

我认为我的核心困惑是关于这两条线与 BBox,以及它们如何交互以创建 11x17 小册子 PDF。感谢任何可以解决此问题的人。

    import sys
    import os

    import find_pdfrw
    from pdfrw import PdfReader, PdfWriter, PdfDict, PdfArray, PdfName, IndirectPdfDict
    from pdfrw.buildxobj import pagexobj
def fixpage(*pages):
    pages = [pagexobj(x) for x in pages]

    class PageStuff(tuple):
        pass

    x = y = 0
    for i, page in enumerate(pages):
        index = '/P%s' % i
        shift_right = x and '1 0 0 1 %s 0 cm ' % x or ''
        stuff = PageStuff((index, page))
        stuff.stream = 'q %s%s Do Q\n' % (shift_right, index)
        x += page.BBox[2]
        y = max(y, page.BBox[3])
        pages[i] = stuff

    # Multiple copies of first page used as a placeholder to
    # get blank page on back.
    for p1, p2 in zip(pages, pages[1:]):
        if p1[1] is p2[1]:
            pages.remove(p1)

    return IndirectPdfDict(
        Type = PdfName.Page,
        Contents = PdfDict(stream=''.join(page.stream for page in pages)),
        MediaBox = PdfArray([0, 0, x, y]),
        Resources = PdfDict(
            XObject = PdfDict(pages),
        ),
    )

inpfn, = sys.argv[1:]
outfn = 'booklet.' + os.path.basename(inpfn)
pages = PdfReader(inpfn).pages

# Use page1 as a marker to print a blank at the end
if len(pages) & 1:
    pages.append(pages[0])

bigpages = []
while len(pages) > 2:
    bigpages.append(fixpage(pages.pop(), pages.pop(0)))
    bigpages.append(fixpage(pages.pop(0), pages.pop()))

bigpages += pages

PdfWriter().addpages(bigpages).write(outfn)
4

1 回答 1

4

Bbox 通常是“边界框”的简写:在这种情况下,是定义页面尺寸的矩形。在这种情况下,它看起来是一个由 4 个数字组成的数组,其中前两个是页面的左上角 (0,0),第三个是页面右侧的 x 坐标(其中,因为左侧为 0,也是宽度),第四个是页面的底部/高度。

于 2013-03-28T14:57:46.980 回答