我正在尝试对我的朴素贝叶斯代码进行拉普拉斯平滑。它在 70% 训练 30% 测试集上给了我 72.5% 的准确率,这有点低。有人看到有什么不对吗?
posTotal=len(pos)
negTotal=len(neg)
for w in larr:
if (w not in pos) or (w not in neg):
unk[w]+=1
unkTotal=len(unk)
else:
if (w in pos):
posP+=(math.log10(pos[w])-math.log10(posTotal))
if (w in neg):
negP+=(math.log10(neg[w])-math.log10(negTotal))
pos
并且neg
是默认的。