0

我们正在实现扩展布尔模型,但我们无法弄清楚如何使用给定的公式:http ://en.wikipedia.org/wiki/Extended_Boolean_model这里的公式:

在此处输入图像描述

包含三个“变量”,但我们不知道它们的含义。假设我们已经处理了文档的集合,所以我们已经映射了集合中的所有单词,并且对于每个术语,我们都有每个文档中的出现次数以及整个集合中(具体术语)的出现次数。

4

1 回答 1

0

我在那里说“与文档 dj 相关的术语 Kx 的权重”。

所以我们谈论的是术语“x”和文档“j”。“i”是使 Idfi(频率最高的术语)最大化的值。

于 2013-04-25T23:29:55.157 回答