我有问题。我需要从 pdf 中提取的一些图像不是图像到 pdf,而是作为 Stamp。我有很多 PDF,我想从这些 PDF 中提取所有邮票和所有图像(我有所有图像的脚本,但不是所有邮票的脚本)。我只想要这些邮票的JPG,但我不知道如何解析这些PDF并提取JPG格式的所有Stamp。我想在 python 3 中做到这一点。
非常感谢!问候,
使用 use 或 pyMuPDF 您可以执行以下操作:
#!/usr/bin/python
import fitz
pdf_document = fitz.open("file.pdf")
for current_page in range(len(pdf_document)):
for annot in pdf_document[current_page].annots():
xref = annot.get_pixmap()
xref.writePNG("page%s-%s.png" % (current_page, xref))