2

这是我写的方法:

def pdf_page_to_png(src_pdf, pagenum=0, resolution=300, slug=''):
    dst_pdf = PyPDF2.PdfFileWriter()
    dst_pdf.addPage(src_pdf.getPage(pagenum))

    pdf_bytes = io.BytesIO()
    dst_pdf.write(pdf_bytes)
    pdf_bytes.seek(0)

    img = Image(file=pdf_bytes, resolution=resolution)
    img.convert("jpeg")

    if pagenum == 0:
        os.makedirs('media/einsert/%s' % slug)

    img.save(filename='media/einsert/%s/page_%s.jpeg' % (slug, pagenum))

    return img

我明白了

'jpeg' 是不受支持的格式

错误

/Users/daro/praca/polsha24/lib/python2.7/site-packages/wand/image.py in format
    def format(self, fmt):
        if not isinstance(fmt, string_type):
            raise TypeError("format must be a string like 'png' or 'jpeg'"
                            ', not ' + repr(fmt))
        fmt = fmt.strip()
        r = library.MagickSetImageFormat(self.wand, binary(fmt.upper()))
        if not r:
                        raise ValueError(repr(fmt) + ' is unsupported format') ...
        r = library.MagickSetFilename(self.wand,
                                      b'buffer.' + binary(fmt.lower()))
        if not r:
            self.raise_exception()
    @property

osx el capitan python 2.7.10 相同的代码适用于其他带有 debian 的计算机。

4

2 回答 2

1

您可能需要安装“ jpeg ”和/或“ ghostscript

对于 mac:

brew install jpeg
brew install ghostscript

对于 Linux:

JPEGhttp ://www.ijg.org/files/

鬼脚本: http : //ghostscript.com/download/

下载并安装最新版本。

它为我解决了类似的问题。

于 2016-07-08T06:36:47.927 回答
0

您误解了 Image.convert 的功能。它不会在文件格式之间转换,而是在像素格式之间转换,例如“RGB”用于 RGB 像素或“CMYK”用于 CMYK 数据。要以特定文件格式实际输出图像,请使用Image.save

jpeg_bytes = io.BytesIO()
img.save(jpeg_bytes, "jpeg")

然后缓冲区jpeg_bytes包含 JPEG 数据。

编辑:如果我没记错的话,PDF 在 PIL 中是只写的。因此,您无法从 PDF 原始数据加载图像。但这是另一个问题...

于 2015-10-25T22:21:12.453 回答