0

遗憾的是,我无法完全理解多项朴素贝叶斯模型中文档概率公式中片段之一的含义。这是关于纸A Comparison of Event Models for Naive Bayes Text Classication,公式 #5:

在此处输入图像描述

有问题的片段是P(|d_i|)- 我无法完全理解,这个概率是什么意思?它只是第 i 个文档的概率吗?如果是,为什么它包含|...|操作?

4

1 回答 1

1

|d_i|是第 i 个文档中的单词数。术语P(|d_i|)是生成包含精确|d_i|单词的文档的概率。

于 2013-01-03T23:30:15.343 回答