更新:感谢 stardt 的脚本有效!pdf是另一个页面的页面。我在另一个上尝试了脚本,它也正确地吐出了每个pdf页面,但是页码的顺序有时是对的,有时是错误的。比如pdf文件的第25-28页,打印的页码是14、15、17、16。我想知道为什么?整个pdf可以从http://download304.mediafire.com/u6ewhjt77lzg/bgf8uzvxatckycn/3.pdf下载
原件:我有一个扫描的 pdf,其中两个纸页并排放置在一个 pdf 页面中。我想将 pdf 页面分成两部分,原来的左半部分成为两个新 pdf 页面中较早的部分。pdf 看起来像.
这是受Gillesun2up
启发命名的 Python 脚本:
#!/usr/bin/env python
import copy, sys
from pyPdf import PdfFileWriter, PdfFileReader
input = PdfFileReader(sys.stdin)
output = PdfFileWriter()
for p in [input.getPage(i) for i in range(0,input.getNumPages())]:
q = copy.copy(p)
(w, h) = p.mediaBox.upperRight
p.mediaBox.upperLeft = (0, h/2)
p.mediaBox.upperRight = (w, h/2)
p.mediaBox.lowerRight = (w, 0)
p.mediaBox.lowerLeft = (0, 0)
q.mediaBox.upperLeft = (0, h)
q.mediaBox.upperRight = (w, h)
q.mediaBox.lowerRight = (w, h/2)
q.mediaBox.lowerLeft = (0, h/2)
output.addPage(q)
output.addPage(p)
output.write(sys.stdout)
我在终端中的 pdf 上尝试了该脚本,命令为un2up < page.pdf > out.pdf
,但输出out.pdf
未正确拆分。
我还检查了变量的值w
和h
的输出p.mediaBox.upperRight
,根据它们的实际比例,它们是514
和1224
不正确的。
该文件可以从http://download851.mediafire.com/bdr4sv7v5nzg/raci13ct5w4c86j/page.pdf下载。