0

如何检测 PDF 文件中的图像(Python)。

我必须检测该图像是否存在于 PDF 文件中。有没有办法这样做。

我已经尝试过 PyPdf 但没有成功。请帮我

感谢任何回应赞赏

4

1 回答 1

3

有PDFMiner。它还有一个Python-API。这可以帮助您搜索图像。通过使用:

from pdfminer.layout import LAParams
from pdfminer.converter import PDFPageAggregator

# Set parameters for analysis.
laparams = LAParams()
# Create a PDF page aggregator object.
device = PDFPageAggregator(rsrcmgr, laparams=laparams)
interpreter = PDFPageInterpreter(rsrcmgr, device)
for page in doc.get_pages():
    interpreter.process_page(page)
    # receive the LTPage object for the page.
    layout = device.get_result()

layout是一个LTPage-object,它基本上是一个页面上所有布局对象的树。你可以沿着这棵树的所有分支走,并检查LTImage某处是否有 -object - 然后你知道有一个图像。

PDFMiner 仅适用于 Python 2.x。

于 2013-01-23T07:36:25.937 回答