我不确定这是否可行,但我正在尝试以自动方式从 pdf 生成一些缩略图,然后将它们存储在 elasticsearch 中。基本上,我想将 pdf 转换为一系列 jpg(或 png 或类似的东西),然后将它们索引为二进制文件。目前我正在像这样制作这些jpg:
import subprocess
params = ['convert', 'pdf_file', 'thumb.jpg']
subprocess.check_call(params)
效果很好,但它只是将jpgs写入文件系统。我希望将这些文件作为字符串而不将它们写入本地文件系统。我试过使用子进程的标准输出方法,但我对使用子进程还很陌生,所以我无法弄清楚这一点。
我正在使用 imagemagick 进行此转换,但只要我能实现此目标,我愿意切换到任何其他工具。有任何想法吗?