Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
我使用 NLTK 训练了一个朴素贝叶斯分类器。
有什么方法可以找到每个标签使用的先验概率(我只使用 2 个标签)。我使用了相同数量的正面和负面推文,因此每个标签的先验应该是 0.5,但是每当我对没有特征的文本进行分类时,我总是得到概率(正面)=0.8076410666128 和概率(负面)=0.192358933872。
这与文本无关。我很困惑为什么模型会为具有 0 个特征的线提供这些概率,并且我认为它与每个标签的先验概率有关。