0

我正在使用 PyMuPDF / Fitz 从 pdf 页面中提取嵌入的图像。这很好用,但有些 pdf 文件,但对于某些文件,图像旋转了 90 度。我看不到任何可用于纠正此问题的条件。有没有人经历过这个?有人有解决方案吗?

我总是很感激帮助!

for img in doc.getPageImageList(i):
    xref = img[0]
    pix = doc.extractImage(xref)
    self.imagefilename = ("p%s-%s." % (i, xref)) + pix["ext"]
    imgout = open(self.imagefilename, 'wb')
    imgout.write(pix["image"])
    imgout.close()
4

2 回答 2

1

来自 repo 维护者的消息:

对于最新的 PyMuPDF 版本(v1.17.0 及更高版本),我决定将未旋转的页面用于可以插入或修改的所有内容。此外,页面上有关对象位置的每个信息现在都与未旋转的页面有关。此外,还有一些补充工具可以在各个坐标系之间进行转换。

顺便说一句:有一个 PyMuPDF 属性Page.rotation返回页面旋转。您可以通过Page.setRotation(90).

于 2020-06-11T13:34:56.420 回答
0

我在这里找到了我自己的问题的答案:

https://stackoverflow.com/a/39324037/8222757

使用 PyPDF2:

pdf = PyPDF2.PdfFileReader(open('example.pdf', 'rb'))
orientation = pdf.getPage(pagenumber).get('/Rotate')

可能的结果可以是0, 90, 180,270None

于 2020-03-05T15:09:47.120 回答