python - 从python中的PDF中提取戳记为jpg

Question

我有问题。我需要从 pdf 中提取的一些图像不是图像到 pdf，而是作为 Stamp。我有很多 PDF，我想从这些 PDF 中提取所有邮票和所有图像（我有所有图像的脚本，但不是所有邮票的脚本）。我只想要这些邮票的JPG，但我不知道如何解析这些PDF并提取JPG格式的所有Stamp。我想在 python 3 中做到这一点。

非常感谢！问候，

score 0 · Accepted Answer

使用 use 或 pyMuPDF 您可以执行以下操作：

#!/usr/bin/python

import fitz

pdf_document = fitz.open("file.pdf")


for current_page in range(len(pdf_document)):
    for annot in pdf_document[current_page].annots():
            xref = annot.get_pixmap()
            xref.writePNG("page%s-%s.png" % (current_page, xref))

python - 从python中的PDF中提取戳记为jpg

1 回答 1

Related

Reference