如何检测 PDF 文件中的图像(Python)。
我必须检测该图像是否存在于 PDF 文件中。有没有办法这样做。
我已经尝试过 PyPdf 但没有成功。请帮我
感谢任何回应赞赏
如何检测 PDF 文件中的图像(Python)。
我必须检测该图像是否存在于 PDF 文件中。有没有办法这样做。
我已经尝试过 PyPdf 但没有成功。请帮我
感谢任何回应赞赏
有PDFMiner。它还有一个Python-API。这可以帮助您搜索图像。通过使用:
from pdfminer.layout import LAParams
from pdfminer.converter import PDFPageAggregator
# Set parameters for analysis.
laparams = LAParams()
# Create a PDF page aggregator object.
device = PDFPageAggregator(rsrcmgr, laparams=laparams)
interpreter = PDFPageInterpreter(rsrcmgr, device)
for page in doc.get_pages():
interpreter.process_page(page)
# receive the LTPage object for the page.
layout = device.get_result()
layout
是一个LTPage
-object,它基本上是一个页面上所有布局对象的树。你可以沿着这棵树的所有分支走,并检查LTImage
某处是否有 -object - 然后你知道有一个图像。
PDFMiner 仅适用于 Python 2.x。