我不确定您为什么会出现内存不足错误,但看起来您返回的数据超出了 V8 堆大小。someIndexedSparseFiler另一种可能性是某些东西导致引擎错过/忽略索引,导致引擎在评估属性之前加载每个文档。
评估数百万个文档(或大量大型文档)不仅会消耗大量磁盘/内存 I/O,而且还可能需要大量 RAM。尝试使用解释功能返回查询分析 - 它应该告诉您出了什么问题。
为了比较,我的查询...
FOR u IN myCollection
FILTER u.someIndexedSparseFiler != null
RETURN u._id
...当我单击“解释”时返回:
Query String (82 chars, cacheable: true):
FOR u IN myCollection
FILTER u.someIndexedSparseFiler != null
RETURN u._id
Execution plan:
Id NodeType Est. Comment
1 SingletonNode 1 * ROOT
7 IndexNode 5 - FOR u IN myCollection /* persistent index scan, projections: `_id` */
5 CalculationNode 5 - LET #3 = u.`_id` /* attribute expression */ /* collections used: u : myCollection */
6 ReturnNode 5 - RETURN #3
Indexes used:
By Name Type Collection Unique Sparse Selectivity Fields Ranges
7 idx_1667363882689101824 persistent myCollection false true 100.00 % [ `someIndexedSparseFiler` ] *
Optimization rules applied:
Id RuleName
1 move-calculations-up
2 move-filters-up
3 move-calculations-up-2
4 move-filters-up-2
5 use-indexes
6 remove-filter-covered-by-index
7 remove-unnecessary-calculations-2
8 reduce-extraction-to-projection
请注意,它列出了我的稀疏索引Indexes used:。另外,尝试更改!=to ==,您会看到现在它忽略了索引!这是因为优化器知道稀疏索引永远不会有null值,所以它会跳过它。
如果您不熟悉它,“解释”功能在调整查询和创建索引时非常有用(实际上是必不可少的)。另外,请记住索引应该与您的查询匹配;在这种情况下,索引应该只有一个属性,否则“选择性”商可能太低,引擎将忽略它。