-1

我使用 PyPDF2 来获取 pdf 文件页面的维度,但对于某些 pdf,它返回负数。为什么?这是一个例子,从第二页开始,实际高度为负数。

from PyPDF2 import PdfFileReader

input_file = PdfFileReader(open('file.pdf', "rb"))
for i in range(input_file.getNumPages()):
    page = input_file.getPage(i)
    real_width, real_height = page.mediaBox.getWidth(), 
page.mediaBox.getHeight()
    print(real_width, real_height)

在某些情况下实际高度是负数,这怎么会发生?

4

1 回答 1

1

因为那是文件中元数据中页面的高度

MediaBox [0 0 792 -612]

您必须询问生成文件的人他们是如何管理的!你可能只是反转它。

于 2019-01-15T16:35:56.013 回答