2

我需要在 Python 中修改文件的 HTTP 标头,我知道这可以使用 Django 'File' 对象(https://docs.djangoproject.com/en/dev/topics/files/),如文档中所述我在这里关注的示例:http: //tmanstwobits.com/convert-your-web-pages-to-pdf-files-using-phantomjs.html

这是我试图在没有 Django 的情况下复制的基本代码:

file_name = '/tmp/current_page.pdf'
url = ('user_current_url')
external_process = Popen(["phantomjs", phantomjs_script, url, file_name],
                         stdout=PIPE, stderr=STDOUT)
# Open the file created by PhantomJS
return_file = File(open(file_name, 'r'))
response = HttpResponse(return_file, mimetype='application/force-download')
response['Content-Disposition'] = 'attachment; filename=current_page.pdf'
# Return the file to the browser and force it as download item
return response

我尝试使用 urllib.urlopen,它允许我修改 HTTP 标头,但我遇到了其他问题,这似乎不是最好的方法。我怎样才能做到这一点?

4

1 回答 1

1

由于您使用的是 Tornado,因此您必须设置一个请求处理程序:

import tornado.ioloop
import tornado.web

class PDFHandler(tornado.web.RequestHandler):
    def get(self):
        filename = 'current_page.pdf'

        self.set_header('Content-Disposition', 'attachment; filename=current_page.pdf')
        self.set_header('Content-Type', 'application/force-download')

        with open(filename, 'r') as handle:
            data = handle.read()
            self.set_header('Content-Length', len(data))
            self.write(data)

if __name__ == "__main__":
    application = tornado.web.Application([
        (r'/', PDFHandler),
    ])

    application.listen(8888)
    tornado.ioloop.IOLoop.instance().start()

我会使用tempfile模块而不是硬编码路径。此外,如果您担心内存使用情况,分块流式传输文件会很好。

于 2013-05-21T22:53:41.810 回答