我正在编写一份文档,该文档应包含使用朴素贝叶斯(生成)和逻辑回归(判别)模型进行文本分类之间的主要区别。
在我的研究中,我遇到了朴素贝叶斯模型的定义:https ://nlp.stanford.edu/IR-book/html/htmledition/naive-bayes-text-classification-1.html
文档
d
在类别c
中的概率计算为 ... 其中p(tk|c)
是术语在类别文档中出现的条件概率...tk
c
当我开始比较生成模型和判别模型时,我发现 StackOverflow 上的这个解释被接受:生成算法和判别算法有什么区别?
生成模型学习联合概率分布
p(x,y)
,判别模型学习条件概率分布p(y|x)
——您应该将其理解为“给定 x 的 y 概率”。
在这一点上,我感到困惑:朴素贝叶斯是一个生成模型并使用条件概率,但同时判别模型被描述为好像它们学习了条件概率,而不是生成模型的联合概率。
有人可以对此有所了解吗?
谢谢!