0

我正在使用 Python/Django。
PyPDF2 来阅读我当前的 pdf。

我想阅读我保存的 pdf 并获取 pdf 中单个页面的方向。

我希望能够确定页面是横向还是纵向。

tempoutpdffilelocation =  settings.TEMPLATES_ROOT + nameOfFinalPdf
pageOrientation = pageToEdit.mediaBox
pdfOrientation = PdfFileReader(file(temppdffilelocation, "rb"))
# tempPdfOrientationPage = pdfOrientation.getPage(numberOfPageToEdit).mediaBox
print("existing pdf width: ")
# print(existing_pdf.getPage(numberOfPageToEdit).getWidth)
# print("get page size with rotation")
# print(tempPdfOrientationPage.getPageSizeWithRotation) 

existing_pdf = pdfOrientation.getPage(numberOfPageToEdit).mediaBox
# print(pageOrientation)
if pageOrientation.getUpperRight_x() - pageOrientation.getUpperLeft_x() > pageOrientation.getUpperRight_y() - pageOrientation.getLowerRight_y():
  print('Landscape')
  print(pageOrientation)
  # print(pdfOrientation.getWidth())
else:
  print('Portrait')
  print(pageOrientation)
  # print(pdfOrientation.getWidth())
# create a new PDF with Reportlab
can = canvas.Canvas(packet, pagesize=letter)

最后一行设置 pagesize=letter 我想根据我当前的 pdf 确定的内容。
这是我的进口:

from PyPDF2 import PdfFileWriter, PdfFileReader
from reportlab.pdfgen import canvas
from reportlab.lib.pagesizes import letter, landscape
import urllib

我试过 pyPdf .mediaBox 但它总是返回与预期文件大小相同的值,而不是实际大小。pyPdf 已经过时了。如您所见,我也尝试过 getWidth 和 withRotation。
我认为 PyPDF2 PdfFileReader 有一种简单的方法来确定所选对象的方向。

任何帮助表示赞赏。谢谢。

4

4 回答 4

5

我只使用/Rotate了页面的“”属性:

OrientationDegrees = pdf.getPage(numberOfPageToEdit).get('/Rotate')

它可以是0, 90, 180, 270None

于 2016-09-05T04:38:20.377 回答
3

rotate 属性将覆盖 mediaBox 设置。考虑到这一点,请在做出最终判断之前检查页面旋转。请注意,文本也可以旋转。

from PyPDF2 import PdfFileReader

pdf_path = 'yourPDFname.pdf'
pdf_reader = PdfFileReader(pdf_path)
deg = pdf_reader.getPage(0).get('/Rotate')    
page = pdf_reader.getPage(0).mediaBox
if page.getUpperRight_x() - page.getUpperLeft_x() > page.getUpperRight_y() -page.getLowerRight_y():
    if deg in [0,180,None]:
        print('Landscape')
    else:
        print('Portrait')
else:
    if deg in [0,180,None]:
        print('Portrait')
    else:
        print('Landscape')
于 2020-03-30T19:01:42.543 回答
1

这个有效,经过全面测试:

import PyPDF2
from PyPDF2  import PdfFileReader

pdf = PdfFileReader(open('YourPDFname.pdf', 'rb'))
page = pdf.getPage(0).mediaBox

if page.getUpperRight_x() - page.getUpperLeft_x() > page.getUpperRight_y() - 
page.getLowerRight_y():
    print('Landscape')
else:
    print('Portrait')
于 2018-05-13T20:22:36.200 回答
0

您可以使用以下代码片段来检测它:

from PyPDF2  import PdfFileReader

pdf = PdfFileReader(file('example.pdf'))
page = pdf.getPage(0).mediaBox
if page.getUpperRight_x() - page.getUpperLeft_x() > page.getUpperRight_y() - 
page.getLowerRight_y():
    print('Landscape')
else:
    print('Portrait')
于 2017-09-02T18:41:00.073 回答