我有一个要求,客户将上传一个包含 image/s 的 pdf 文件。我必须阅读该 pdf 文件,从中提取图像,然后将该图像保存到数据库和硬盘中。但我不知道如何使用 Python/Django 代码从 pdf 文件中提取图像。是否有任何可用的 python 库可以从 pdf 文件中读取和提取图像。
提前致谢。
我不确定你是否会为此找到一个 python 库。但是,如果您对外部工具没问题,那么 pdfimages 可以完成这项工作
http://en.wikipedia.org/wiki/Pdfimages
我将它与子流程一起用于我的一个项目。