注意:我在这里使用 db(不是 ndb)。我知道 ndb 有一个 count_async() 但我希望有一个不涉及迁移到 ndb 的解决方案。
有时我需要准确计算与查询匹配的实体数量。使用 db 这很简单:
q = some Query with filters
num_entities = q.count(limit=None)
每个实体花费一个小的数据库操作,但它可以让我得到我需要的信息。问题是我经常需要在同一个请求中执行其中的一些,异步执行它们会很好,但我在 db 库中看不到对它的支持。
我在想我可以使用 run(keys_only=True, batch_size=1000) 因为它异步运行查询并返回一个迭代器。我可以先在每个查询上调用 run(),然后再计算每个迭代器的结果。它的成本与 count() 相同,但 run() 已被证明在测试中速度较慢(可能是因为它实际上返回结果),事实上,无论我将它设置多高,batch_size 似乎都被限制在 300,这需要更多的 RPC比 count() 方法计算数千个实体。
我的 run() 测试代码如下所示:
queries = list of Queries with filters
iters = []
for q in queries:
iters.append( q.run(keys_only=True, batch_size=1000) )
for iter in iters:
count_entities_from(iter)