我有一个 pdf 文档,这个页面有一个图表的图像,但是该图的图例不是图像的一部分。我正在使用 pymupdf 提取此图像,如下所示:
for img in doc.getPageImageList(page_num, full=True):
xref = img[0]
pix = fitz.Pixmap(doc, xref)
if pix.n - pix.alpha < 4: # this is GRAY or RGB
pix.writePNG(basePath+"/test_data/"+fund_type+"/%s-%s.png" % (filename+str(page_num), xref))
print(filename + ' : ' + basePath + "/test_data/" + fund_type+ '/'+filename+ str(page_num) + '-'+str(xref), file=f)
现在,这给了我图像(图表)。我希望能够在图像下方捕获一些高度,以便将图例也捕获为图像的一部分。这可能使用pymupdf吗?任何代码指针也会有所帮助。