0

我对 Berkeley DB 还很陌生,我正在尝试在 Python 中将它与 bsddb3 一起使用,并带有用于电源安全的事务 使用 DB_AUTO_COMMIT 并且没有事务参数读取和写入工作得很好。但是,当我使用手动事务调用 get/put 时,调用会无限期挂起,几乎不使用 CPU(大约 50k 周期/秒)并且不执行磁盘 I/O。

    _data_store_env.log_set_config(bdb.DB_LOG_AUTO_REMOVE, True)
    _data_store_env.set_lg_max(256 * 2**20)
    _data_store_env.set_cachesize(0, 512 * 2**20)
    _data_store_env.set_lg_dir(str(_journal_path))
    _data_store_env.set_tmp_dir(str(tmp_dir))
    _data_store_env.open(str(_bulk_data_path), bdb.DB_CREATE | bdb.DB_INIT_LOCK | bdb.DB_INIT_LOG | bdb.DB_INIT_MPOOL | bdb.DB_INIT_TXN | bdb.DB_RECOVER | bdb.DB_THREAD)

    # Originally I simply used DB_AUTO_COMMIT, but I changed it to see if this way would fix the hang. It didn't.
    txn = _data_store_env.txn_begin()

    _data_store = bdb.DB(_data_store_env)
    _data_store.set_flags(bdb.DB_CHKSUM)
    _data_store.set_pagesize(65536)
    _data_store.open("filestore.db", None, bdb.DB_HASH, bdb.DB_CREATE | bdb.DB_THREAD, 0x660, txn)

    _idx_store = bdb.DB(_data_store_env)
    _idx_store.set_flags(bdb.DB_CHKSUM | bdb.DB_DUPSORT)
    _idx_store.open("idxstore.db", None, bdb.DB_HASH, bdb.DB_CREATE | bdb.DB_THREAD, 0x660, txn)
    _data_store.associate(_idx_store, lambda key, data: key[0:9], bdb.DB_IMMUTABLE_KEY, txn)

    txn.commit()
...
    # It doesn't matter whether this flag is present or not. Both produce the same result.
    txn = _data_store_env.txn_begin(None, bdb.DB_TXN_BULK)
...
    # Never returns
    file_exists = _idx_store.has_key(entry_key, txn)
...
    # Also never returns
    _data_store.put(file_hash, file_data, txn)

难道我做错了什么?事务甚至可以在 bsddb3 中工作吗?

4

1 回答 1

0

在使用本机代码调试器进行数小时调试后,我相信我已经非常接近根本原因。似乎挂起不会发生在 get/put 调用中,而是在它之后 - 在对len的调用中在 get/put 调用完成后由调试器 GUI 执行的数据库对象上(以及如果程序自由运行则定期执行)。这显然陷入了一个永远不会完成的资源获取循环,因为事务正在进行中(我没有用于构建 bsddb3 的符号 - 它静态链接到 BDB,不少于 - 所以我对花费不感兴趣是时候弄清楚 DB_length 调用下方的调用堆栈中的十几个函数是什么了)。这也可能与我将 bsddb3 引入项目时对任何调试器命令的响应时间增加到大约 5 秒(当它没有死锁时)这一事实有关。

总之,这似乎是调试器 GUI 试图使其变量窗口保持最新与 bsddb3 DB 应该是映射的设计决策之间的有害交互。我非常愿意接受有关如何解决此问题的建议;我尝试了一些方法,但无法弄清楚如何从 DB 对象中删除len方法(它是一个只读属性,因为它是用 C 实现的)。现在我正在围绕不是序列的数据库创建一个包装器;除非您不小心将鼠标悬停在 DB 对象上并且调试器尝试获取其属性,否则它可以解决问题。

于 2018-04-20T14:23:35.073 回答