2

我想知道,我是否应该尽量减少 db_session 的使用?让我们考虑这两个等价的例子:

一个)

def do_stuff():
    with db_session:
        task = orm.make_proxy(Task.select().first())
        task.mark_started()
    ...
    this_function_might_take_a_long_time(task)
    ...
    with db_session:
        task.mark_done()

二)

@db_session
def do_stuff():
    task = Task.select().first()
    task.mark_started()
    commit()
    ...
    this_function_might_take_a_long_time(task)
    ...
    task.mark_done()

通过阅读文档,我可以看出 Pony不鼓励对 db_sessions 进行微观管理

With this code each of view function you will define will be wrapped with db_session so you should not care about them.

但是,在这里 它表明打开它可能会产生成本(编辑:它没有,请阅读答案)

Before sending the first query, Pony gets a database connection from the connection pool.

我是否正确地说除了 B 之外的任何东西都是过早的优化,而 A 应该只在有限的数据库连接计数场景中考虑?

4

1 回答 1

3

Pony ORM 作者Alexander Kozlovsky @metaprogrammer 在官方 Pony ORM 电报聊天中回答了这个问题。


db_session 的目的是管理三件事:

数据库连接

Pony 将单独的连接关联到每个线程。如果进程不使用线程,则只使用一个连接。当 db_session 结束时,它会将其连接返回到连接池。这意味着连接保持打开状态并保留以供将来使用。下一个 db_session 将使用相同的连接。因此,关于连接使用,单个 db_session 和多个连续 db_session 之间没有区别

交易状态

当 db_session 结束时,它执行隐式提交。隐式提交和显式提交之间没有区别,因此如果您有一个带有手动 commit() 调用的单个 db_session,它与多个顺序 db_session 相同。但是,如果您不使用显式 commit(),那么长 db_session 可能会持有数据库锁定并阻止其他进程使用数据库或特定表,直到执行提交

加载对象的内存缓存

单个 db_session 和多个顺序 db_session 之间的主要区别在于管理从数据库加载的对象的内存缓存。每个 db_session 都有单独的缓存。缓存中的对象由关系交叉链接。如果您加载一堆 od Course、Student 和 Group 对象,它们都通过关系属性相互链接。因此,不可能从缓存中卸载一些对象并保留其余对象。垃圾收集器不能只从缓存中收集一些对象,因为它们都是通过循环引用相互指向的。因此,只有在 db_session 完成后才能将缓存整体删除。所以,如果你有一个长期存在的 db_session,它直到最后都不会释放内存。但是几个较小的 db_session 可能需要多次从数据库中加载同一个对象。

PS 即使 db_session 完成,连接仍将保持直到程序结束或显式 db.disconnect() 调用。仅当 db_session 中的某些数据库异常导致回滚时,Pony 才会隐式关闭连接。

于 2019-03-14T22:34:43.733 回答