python - Python PyMuPDF / Fitz 从 extractImage 旋转图像

Question

我正在使用 PyMuPDF / Fitz 从 pdf 页面中提取嵌入的图像。这很好用，但有些 pdf 文件，但对于某些文件，图像旋转了 90 度。我看不到任何可用于纠正此问题的条件。有没有人经历过这个？有人有解决方案吗？

我总是很感激帮助！

for img in doc.getPageImageList(i):
    xref = img[0]
    pix = doc.extractImage(xref)
    self.imagefilename = ("p%s-%s." % (i, xref)) + pix["ext"]
    imgout = open(self.imagefilename, 'wb')
    imgout.write(pix["image"])
    imgout.close()

score 1 · Accepted Answer

来自 repo 维护者的消息：

对于最新的 PyMuPDF 版本（v1.17.0 及更高版本），我决定将未旋转的页面用于可以插入或修改的所有内容。此外，页面上有关对象位置的每个信息现在都与未旋转的页面有关。此外，还有一些补充工具可以在各个坐标系之间进行转换。

顺便说一句：有一个 PyMuPDF 属性Page.rotation返回页面旋转。您可以通过Page.setRotation(90).

score 0 · Accepted Answer

我在这里找到了我自己的问题的答案：

https://stackoverflow.com/a/39324037/8222757

使用 PyPDF2：

pdf = PyPDF2.PdfFileReader(open('example.pdf', 'rb'))
orientation = pdf.getPage(pagenumber).get('/Rotate')

可能的结果可以是0, 90, 180,270或None

python - Python PyMuPDF / Fitz 从 extractImage 旋转图像

2 回答 2

Related

Reference