0

我找到了一个关于多项式朴素贝叶斯分类器的链接

多项朴素贝叶斯链接

我们如何计算B'or |V|

该页面说它是词汇表中的术语数。在它的例子中,我们怎么能6得到B?它是所有术语的计数吗?

“中国”、“北京”、“上海”、“meacao”、“东京”、“日本”

还有一个问题,如果新词出现在测试文档中怎么办?例如,在 doc 6 中出现了“bangkok”或任何从未出现过的新词。如何计算新词的概率?

4

1 回答 1

1

你说的对。它是词汇表中的单词总数,因为词汇表中的一个术语只能有一个条目。

于 2013-04-20T08:29:24.967 回答