13

我有一个使用 Python/Bottle 编写的 REST 前端,它处理文件上传,通常是大文件。API 的编写方式如下:

客户端将 PUT 与文件一起作为有效负载发送。除其他外,它发送 Date 和 Authorization 标头。这是一种针对重放攻击的安全措施——请求使用临时密钥、目标 url、日期和其他一些东西进行签名

现在的问题。如果提供的日期在 15 分钟的给定日期时间窗口内,则服务器接受请求。如果上传需要足够长的时间,它将比允许的时间增量更长。现在,请求授权处理是使用瓶子视图方法上的装饰器完成的。但是,除非上传完成,否则瓶子不会启动调度过程,因此在较长的上传时验证会失败。

我的问题是:有没有办法向瓶子或 WSGI 解释以立即处理请求并在上传时进行流式传输?由于其他原因,这对我也很有用。还是有其他解决方案?在我写这篇文章时,我想到了 WSGI 中间件,但我仍然想要外部洞察力。

我愿意切换到 Flask,甚至其他 Python 框架,因为 REST 前端非常轻量级。

谢谢

4

2 回答 2

20

我建议在前端将传入的文件分割成更小的块。我这样做是为了在 Flask 应用程序中实现大文件上传的暂停/恢复功能。

使用Sebastian Tschan 的 jquery 插件maxChunkSize,您可以通过在初始化插件时指定 a 来实现分块,如下所示:

$('#file-select').fileupload({
    url: '/uploads/',
    sequentialUploads: true,
    done: function (e, data) {
        console.log("uploaded: " + data.files[0].name)
    },
    maxChunkSize: 1000000 // 1 MB
});

现在客户端在上传大文件时会发送多个请求。您的服务器端代码可以使用Content-Range标头将原始大文件修补在一起。对于 Flask 应用程序,视图可能类似于:

# Upload files
@app.route('/uploads/', methods=['POST'])
def results():

    files = request.files

    # assuming only one file is passed in the request
    key = files.keys()[0]
    value = files[key] # this is a Werkzeug FileStorage object
    filename = value.filename

    if 'Content-Range' in request.headers:
        # extract starting byte from Content-Range header string
        range_str = request.headers['Content-Range']
        start_bytes = int(range_str.split(' ')[1].split('-')[0])

        # append chunk to the file on disk, or create new
        with open(filename, 'a') as f:
            f.seek(start_bytes)
            f.write(value.stream.read())

    else:
        # this is not a chunked request, so just save the whole file
        value.save(filename)

    # send response with appropriate mime type header
    return jsonify({"name": value.filename,
                    "size": os.path.getsize(filename),
                    "url": 'uploads/' + value.filename,
                    "thumbnail_url": None,
                    "delete_url": None,
                    "delete_type": None,})

对于您的特定应用程序,您只需确保仍然随每个请求发送正确的身份验证标头。

希望这可以帮助!我在这个问题上苦苦挣扎了一段时间;)

于 2013-04-15T15:09:41.800 回答
2

使用 plupload 解决方案时可能是这样的:

$("#uploader").plupload({
    // General settings
    runtimes : 'html5,flash,silverlight,html4',
    url : "/uploads/",

    // Maximum file size
    max_file_size : '20mb',

    chunk_size: '128kb',

    // Specify what files to browse for
    filters : [
        {title : "Image files", extensions : "jpg,gif,png"},
    ],

    // Enable ability to drag'n'drop files onto the widget (currently only HTML5 supports that)
    dragdrop: true,

    // Views to activate
    views: {
        list: true,
        thumbs: true, // Show thumbs
        active: 'thumbs'
    },

    // Flash settings
    flash_swf_url : '/static/js/plupload-2.1.2/js/plupload/js/Moxie.swf',

    // Silverlight settings
    silverlight_xap_url : '/static/js/plupload-2.1.2/js/plupload/js/Moxie.xap'
});

在这种情况下,您的 flask-python 代码将类似于:

from werkzeug import secure_filename

# Upload files
@app.route('/uploads/', methods=['POST'])
def results():
    content = request.files['file'].read()
    filename = secure_filename(request.values['name'])

    with open(filename, 'ab+') as fp:
        fp.write(content)

    # send response with appropriate mime type header
    return jsonify({
        "name": filename,
        "size": os.path.getsize(filename),
        "url": 'uploads/' + filename,})

Plupload 总是以完全相同的顺序发送块,从头到尾,所以你不必费心寻找或类似的事情。

于 2015-03-24T17:35:32.460 回答