1

我正在对发票和收据进行分类,我将使用伯努利模型。

这是朴素贝叶斯分类器:

P(c|x) = P(x|c) x P(c) / P(x)

我知道如何计算 P(c) 类先验概率,因为我们假设所有单词都是独立的,所以我们不需要 P(x)。

现在公式将是这样的: P(c|x) = P(x|c) x P(c) 为了计算 P(x|c),我们使用似然法计算所有单词的概率 P(c| X) = P(x1|c)P(x2|c)*P(x3|c)....

我的问题是在计算似然之后我是否需要将它与 P(c) 相乘,P(c|X) = P(x1|c)P(x2|c)*P(x3|c)... *个人电脑)?

4

1 回答 1

1

P(c|x) 等于 P(x|c) P(c)。它是成比例的,就像你在分类时所做的那样

cl(x) = arg max_c P(c|x) = arg max_c P(x|c) P(c) / P(x) = arg max_c P(x|c) P(c)

这适用于每个概率分布P(x)>0此时 不需要任何贝叶斯假设。这只是一个简单的贝叶斯定理 + 注意P(x)在这个方程中只是​​一个正常数。

因此,您从不实际计算P(c|x),您只需计算P(x|c) P(c)哪个会给您相同的分类。我希望这表明您的分类必须基于 和 的乘积P(x|c)P(c)正如您所指出的那样P(x|c) = PROD_i P(x_i|c)(这里我们使用关于独立性的朴素贝叶斯假设,而不是之前)。

于 2015-11-12T20:36:07.443 回答