search - Lucene：打开 IndexReader 的计算成本将如何随着索引大小的增加而增加？

Question

我的意思是当索引大小急剧增加时，例如从 1GB 到 1TB，在该索引上打开 IndexReader 的计算成本将如何增加？这是线性趋势吗？

score 2 · Accepted Answer

趋势是线性的，但前面的常数应该很小。此外，成本主要是 IO 而不是 CPU。

IndexReader 预先加载某些数据结构，例如术语索引、已删除文档位向量、规范/FieldCache/doc 值（在需要它们的第一个查询上）。除了字段缓存，加载这些结构主要是 IO（而不是 CPU）成本，并且成本应该是相当低的每个文档的常数因子。

重/大的东西（帖子、存储字段、术语向量）都留在磁盘上。

1 回答 1