我有一个寻找大写字母的朴素贝叶斯分类器(用 WEKA 实现)。
contains_A
contains_B
...
contains_Z
对于某个类别,LCD 一词几乎出现在训练数据的每个实例中。当我得到“LCD”属于该类的概率时,它类似于 0.988。赢。
当我得到“L”的概率时,我得到一个普通的 0,而对于“LC”,我得到 0.002。由于特征是幼稚的,L,C和D不应该独立地贡献整体概率,结果“L”有一些概率,“LC”更多,“LCD”更多吗?
同时,使用 MLP 进行相同的实验,而不是具有上述行为,它给出了 0.006、0.5 和 0.8 的百分比
所以 MLP 做了我期望朴素贝叶斯做的事情,反之亦然。我错过了什么,谁能解释这些结果?