Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
我的意思是当索引大小急剧增加时,例如从 1GB 到 1TB,在该索引上打开 IndexReader 的计算成本将如何增加?这是线性趋势吗?
趋势是线性的,但前面的常数应该很小。此外,成本主要是 IO 而不是 CPU。
IndexReader 预先加载某些数据结构,例如术语索引、已删除文档位向量、规范/FieldCache/doc 值(在需要它们的第一个查询上)。除了字段缓存,加载这些结构主要是 IO(而不是 CPU)成本,并且成本应该是相当低的每个文档的常数因子。
重/大的东西(帖子、存储字段、术语向量)都留在磁盘上。