Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
我们正在实现扩展布尔模型,但我们无法弄清楚如何使用给定的公式:http ://en.wikipedia.org/wiki/Extended_Boolean_model这里的公式:
包含三个“变量”,但我们不知道它们的含义。假设我们已经处理了文档的集合,所以我们已经映射了集合中的所有单词,并且对于每个术语,我们都有每个文档中的出现次数以及整个集合中(具体术语)的出现次数。
我在那里说“与文档 dj 相关的术语 Kx 的权重”。
所以我们谈论的是术语“x”和文档“j”。“i”是使 Idfi(频率最高的术语)最大化的值。