0

我的意思是当索引大小急剧增加时,例如从 1GB 到 1TB,在该索引上打开 IndexReader 的计算成本将如何增加?这是线性趋势吗?

4

1 回答 1

2

趋势是线性的,但前面的常数应该很小。此外,成本主要是 IO 而不是 CPU。

IndexReader 预先加载某些数据结构,例如术语索引、已删除文档位向量、规范/FieldCache/doc 值(在需要它们的第一个查询上)。除了字段缓存,加载这些结构主要是 IO(而不是 CPU)成本,并且成本应该是相当低的每个文档的常数因子。

重/大的东西(帖子、存储字段、术语向量)都留在磁盘上。

于 2013-05-30T10:44:17.943 回答