3

给定具有多页的 PDF 文档,如何检查给定页面是否旋转(-90、90 或 180º)?最好使用 Python (pdfminer, pyPDF) ...

更新:页面被扫描,大部分页面由文本组成。

4

3 回答 3

2

我简单地使用/Rotate了页面的属性PyPDF2

 pdf = PyPDF2.PdfFileReader(open('example.pdf', 'rb'))
 orientation = pdf.getPage(pagenumber).get('/Rotate')

它可以是0, 90, 180,270None

于 2016-09-05T04:41:21.593 回答
0

如果您正在使用 PDFMiner 并希望每页的方向:

from pdfminer.pdfpage import PDFPage
from io import StringIO
from pdfminer.pdfparser import PDFParser
from pdfminer.pdfdocument import PDFDocument
from pdfminer.pdfpage import PDFPage
from pdfminer.pdfinterp import PDFResourceManager, PDFPageInterpreter
from pdfminer.converter import TextConverter
from pdfminer.layout import LAParams

output_string = StringIO()
resource_manager = PDFResourceManager()
device = TextConverter(resource_manager, output_string, 
laparams=LAParams())
interpreter = PDFPageInterpreter(resource_manager, device)

for page in PDFPage.get_pages(open('sample.pdf', 'rb')):
    interpreter.process_page(page)

    if page.mediabox[2] - page.mediabox[0] > page.mediabox[3] - page.mediabox[1]:
        orientation = 'Landscape'
    else:
        orientation = 'Portrait'
于 2021-07-07T20:11:41.553 回答
0

如果您正在使用,您可以通过调用实例的属性pdfminer来获得旋转。.rotatePDFPage

for page in PDFPage.create_pages(doc):
    interpreter.process_page(page)
    r = page.rotate
于 2021-03-06T03:48:45.913 回答