0

我有问题。我需要从 pdf 中提取的一些图像不是图像到 pdf,而是作为 Stamp。我有很多 PDF,我想从这些 PDF 中提取所有邮票和所有图像(我有所有图像的脚本,但不是所有邮票的脚本)。我只想要这些邮票的JPG,但我不知道如何解析这些PDF并提取JPG格式的所有Stamp。我想在 python 3 中做到这一点。

非常感谢!问候,

4

1 回答 1

0

使用 use 或 pyMuPDF 您可以执行以下操作:

#!/usr/bin/python

import fitz

pdf_document = fitz.open("file.pdf")


for current_page in range(len(pdf_document)):
    for annot in pdf_document[current_page].annots():
            xref = annot.get_pixmap()
            xref.writePNG("page%s-%s.png" % (current_page, xref))
于 2021-08-18T10:58:01.707 回答