0

我正在尝试提供基于烧瓶的微服务来公开数据库中的一些数据。在服务器端,数据在被提供之前被预先处理并放入一个 pandas DataFrame 中。

一种简单的选择是将其作为 json 文件提供。但这很无聊和浪费。我的首选选项是使用羽毛二进制格式。如果它是预先存在的文件,我设法发送羽毛文件。问题是我无法调用在to_feather()到达端点时调用的函数内部的方法,以便能够根据给定端点的参数动态生成数据帧。

from flask import Flask, send_file
import pandas as pd
import feather

app = Flask(__name__)

def generate_df():
    data = [{'a': 1, 'b': 2}, {'a': 5, 'b': 10, 'c': 20}]
    return pd.DataFrame(data)

@app.route('/serve', methods=['GET'])
def serve():
    return send_file('static.feather', attachment_filename='static.feather')

@app.route('/generate', methods=['GET'])
def generate():
    df = generate_df()
    df.to_feather('dynamic.feather')  # This line is not saving a file
    return send_file('dynamic.feather', attachment_filename='dynamic.feather') 

if __name__ == '__main__':
    app.debug = True
    app.run()

问题是如何强制将羽毛文件的刷新(?)放入磁盘以便能够为它提供服务,或者是否有更好的方法。

4

1 回答 1

4

答案是将羽毛保存到缓冲区而不是磁盘并发送所述缓冲区。这样就不需要处理路径,这是最初的问题。这也解决了在同时请求时覆盖临时文件的问题。

from flask import Flask, send_file
from io import BytesIO

import pandas as pd
import feather

app = Flask(__name__)

def generate_df():
    data = [{'a': 1, 'b': 2}, {'a': 5, 'b': 10, 'c': 20}]
    return pd.DataFrame(data)

@app.route('/generate', methods=['GET'])
def generate():
    df = generate_df()
    feather_buffer = BytesIO()
    feather.write_dataframe(df, feather_buffer)
    feather_buffer.seek(0)
    return send_file(feather_buffer,
                     attachment_filename='dynamic.feather',
                     as_attachment=True)

if __name__ == '__main__':
    app.debug = True
    app.run()
于 2017-11-28T09:37:15.293 回答