我是 Python 新手,正在尝试掌握现有脚本。此示例来自 pdfrw,如下所示:http ://code.google.com/p/pdfrw/wiki/ExampleTools
“带有精美打印机和/或 Acrobat 完整副本的打印机可以轻松地将您的小型 PDF 转换为小册子(例如,在单个 11" x 17" 上打印 4 个字母大小的页面)。
但这假设有几件事,包括人员知道如何操作硬件和软件。booklet.py 可让您将 PDF 转换为预先格式化的小册子,以减少他们搞砸的机会:"
尽我所能告诉的步骤是:
- 该函数开始循环浏览页面
- 声明了一个变量“shift_right” ??? (我认为它是用于元数据的?)
- 声明了一个仅对元数据有用的变量“stuff”(我认为)
- x 增加 BBox 列表的第三个索引(这个列表是什么,它是什么时候建立的?)
- y 分配给 y 和 Bbox 列表的第三个索引之间的较大值(同样,这个列表指的是什么?)
我认为我的核心困惑是关于这两条线与 BBox,以及它们如何交互以创建 11x17 小册子 PDF。感谢任何可以解决此问题的人。
import sys
import os
import find_pdfrw
from pdfrw import PdfReader, PdfWriter, PdfDict, PdfArray, PdfName, IndirectPdfDict
from pdfrw.buildxobj import pagexobj
def fixpage(*pages):
pages = [pagexobj(x) for x in pages]
class PageStuff(tuple):
pass
x = y = 0
for i, page in enumerate(pages):
index = '/P%s' % i
shift_right = x and '1 0 0 1 %s 0 cm ' % x or ''
stuff = PageStuff((index, page))
stuff.stream = 'q %s%s Do Q\n' % (shift_right, index)
x += page.BBox[2]
y = max(y, page.BBox[3])
pages[i] = stuff
# Multiple copies of first page used as a placeholder to
# get blank page on back.
for p1, p2 in zip(pages, pages[1:]):
if p1[1] is p2[1]:
pages.remove(p1)
return IndirectPdfDict(
Type = PdfName.Page,
Contents = PdfDict(stream=''.join(page.stream for page in pages)),
MediaBox = PdfArray([0, 0, x, y]),
Resources = PdfDict(
XObject = PdfDict(pages),
),
)
inpfn, = sys.argv[1:]
outfn = 'booklet.' + os.path.basename(inpfn)
pages = PdfReader(inpfn).pages
# Use page1 as a marker to print a blank at the end
if len(pages) & 1:
pages.append(pages[0])
bigpages = []
while len(pages) > 2:
bigpages.append(fixpage(pages.pop(), pages.pop(0)))
bigpages.append(fixpage(pages.pop(0), pages.pop()))
bigpages += pages
PdfWriter().addpages(bigpages).write(outfn)