0

我想知道 Lucene 的分析器是否使用 tf-idf 表示来构建索引。

谢谢

4

1 回答 1

2

否:分析器只是将文档分解为令牌流。

IndexWriter 是一个分析消费者,它构建一个倒排索引,记录原始统计信息,例如该术语在文档中出现的次数以及有多少文档包含该术语。

但这不是 tf/idf 表示:索引格式独立于评分模型。

于 2012-05-25T06:51:48.940 回答