我找到了一个关于多项式朴素贝叶斯分类器的链接
我们如何计算B'
or |V|
?
该页面说它是词汇表中的术语数。在它的例子中,我们怎么能6
得到B
?它是所有术语的计数吗?
“中国”、“北京”、“上海”、“meacao”、“东京”、“日本”
还有一个问题,如果新词出现在测试文档中怎么办?例如,在 doc 6 中出现了“bangkok”或任何从未出现过的新词。如何计算新词的概率?
我找到了一个关于多项式朴素贝叶斯分类器的链接
我们如何计算B'
or |V|
?
该页面说它是词汇表中的术语数。在它的例子中,我们怎么能6
得到B
?它是所有术语的计数吗?
“中国”、“北京”、“上海”、“meacao”、“东京”、“日本”
还有一个问题,如果新词出现在测试文档中怎么办?例如,在 doc 6 中出现了“bangkok”或任何从未出现过的新词。如何计算新词的概率?