Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
我想知道 Lucene 的分析器是否使用 tf-idf 表示来构建索引。
谢谢
否:分析器只是将文档分解为令牌流。
IndexWriter 是一个分析消费者,它构建一个倒排索引,记录原始统计信息,例如该术语在文档中出现的次数以及有多少文档包含该术语。
但这不是 tf/idf 表示:索引格式独立于评分模型。