我在 Lucene 的Similarity
类public float idf(Term term, Searcher searcher)
方法 javadoc 上找到了这个:
请注意,使用 Searcher.maxDoc() 代替 IndexReader#numDocs() 因为也使用了 Searcher.docFreq(Term),当后者不准确时,Searcher.maxDoc() 也是如此,并且方向相同。此外,Searcher.maxDoc() 的计算效率更高。
这对我来说不太合理。这与 IndexReader 中的文档删除有关吗?