背景:
我们有一个使用 SqlAlchemy 作为 ORM 的 Python Web 应用程序。我们目前使用 Gunicorn(sync worker) 运行这个应用程序。此应用程序仅用于响应长时间运行的请求(即服务大文件,请不要建议使用 X-Sendfile/X-Accel-Redirect,因为响应是从 Python 应用程序动态生成的)。
使用 Gunicorn 同步 worker,当我们运行 8 个 worker 时,只有 8 个请求同时被服务。由于所有这些响应都是 IO 绑定的,我们希望切换到异步工作器类型以获得更好的吞吐量。
我们在 Gunicorn 配置文件中将 worker 类型从 sync 切换为 eventlet。现在我们可以同时响应所有请求,但是又出现了另一个神秘(对我来说很神秘)的问题。
在应用程序中,我们在模块级别有一个作用域会话对象。以下代码来自我们的 orm.py 文件:
uri = 'mysql://%s:%s@%s/%s?charset=utf8&use_unicode=1' % (\
config.MYSQL_USER,
config.MYSQL_PASSWD,
config.MYSQL_HOST,
config.MYSQL_DB,
)
engine = create_engine(uri, echo=False)
session = scoped_session(sessionmaker(
autocommit=False,
autoflush=False,
bind=engine,
query_cls=CustomQuery,
expire_on_commit=False
))
我们的应用程序使用这样的会话:
from putio.models import session
f = session.query(File).first()
f.name = 'asdf'
session.add(f)
session.commit()
当我们使用同步工作者时,会话一次从 1 个请求中使用。在我们切换到异步 eventlet worker 之后,同一个 worker 中的所有请求都共享同一个 session,这是不需要的。当会话在一个请求中提交或发生异常时,所有其他请求都会失败,因为会话是共享的。
在 SQLAlchemy 的文档中,说 scoped_session 用于线程环境中的单独会话。异步工作者中的 AFAIK 请求在同一线程中运行。
问题:
我们希望异步工作者中的每个请求都有单独的会话。在 SQLAlchemy 中使用异步工作者会话的正确方法是什么?