我正在尝试使用外观很棒的 Python 的 PDFTron 库从一系列 PDF 文档中删除大量非常小的图像。基本上,我想通过遍历现有 PDF 文件中的每个元素并将满足特定大小标准的元素复制到相同位置的新 PDF 来创建新 PDF。
有人可以指导我阅读专门针对 Python 的 PDFTron 文档来帮助我完成这项工作吗?或者提供一个检查图像大小的示例脚本?我想我可以做剩下的(强调思考)。PDFTron 网站上提供的文档并非专门针对 Python,很难查找我需要的内容......
您可以从 ElementEdit 示例中看到如何从文档中删除所有图像:
http://www.pdftron.com/pdfnet/samplecode.html#ElementEdit
或者提供一个检查图像大小的示例脚本?
您能否澄清“图像大小”的含义?如果您指的是 PDF 页面中显示的图像尺寸,您可以使用 Element.GetBBox 进行检查。如果您指的是原始图像的尺寸,您可以使用 Element.GetImageWidth 和 Element.GetImageHeight 进行检查(请参阅http://www.pdftron.com/pdfnet/samplecode.html#ImageExtract)。此外,Image.GetImageDataSize 以字节为单位为您提供图像数据的大小。