什么是朴素的朴素贝叶斯?
5 回答
Wikipedia 上有一个很好的例子:
简而言之,朴素贝叶斯分类器假设在给定类变量的情况下,一个类的特定特征的存在(或不存在)与任何其他特征的存在(或不存在)无关。例如,如果一个水果是红色的、圆形的并且直径约为 4 英寸,那么它可能被认为是一个苹果。即使这些特征相互依赖或依赖于其他特征的存在,朴素贝叶斯分类器也会考虑所有这些属性独立地影响了这种水果是苹果的概率。
基本上,它是“幼稚的”,因为它做出的假设可能会或可能不会被证明是正确的。
如果您的数据由特征向量 X = {x1, x2, ... x10} 和您的类标签 y = {y1, y2, .. y5} 组成,贝叶斯分类器将正确的类标签识别为最大化的类标签以下公式:
P(y|X) = P(X|y) * P(y) = P(x1,x2,...,x10|y) * P(y)
就目前而言,它仍然不幼稚。然而,P(x1,x2,...,x10|y) 很难计算,所以我们假设特征是独立的,这就是我们所说的朴素假设,因此,我们最终得到以下公式:
P(y|X) = P(x1|y) * P(x2|y) * ... * P(x10|y) * P(y)
它之所以被称为幼稚,是因为它假设所有属性都是相互独立的。这个假设就是为什么它被称为幼稚的原因,因为在许多现实世界的情况下这并不适合。尽管如此,分类器在许多现实世界的情况下工作得非常好,并且在某些情况下(尽管不是全部)具有与中性网络和 SVM 相当的性能。
对于分类,当我们找到联合分布时,问题在于它只是反映了训练数据并且也很难计算。所以我们需要一些更有用的概括。
朴素模型强烈概括每个属性独立于任何其他属性分布。
它确实有助于在很大程度上不关心属性之间的依赖关系。
在这里,我分享一个关于朴素贝叶斯分类器的实用解释的好文档,它会给你一个很好的想法。