我的要求是接收新闻文章并确定它们对某个主题是正面的还是负面的。我正在采用下面概述的方法,但我一直在阅读 NLP 可能在这里有用。我读过的所有内容都指向 NLP 从事实中检测意见,我认为这对我来说并不重要。我想知道两件事:
1) 为什么我的算法不起作用和/或我该如何改进它?(我知道讽刺可能是一个陷阱,但我再次认为在我们将获得的新闻类型中不会发生太多)
2) NLP 有什么帮助,我为什么要使用它?
我的算法方法(我有正面、负面和否定词的字典):
1) 统计文章中正负词的个数
2)如果否定词与肯定词或否定词的2或3个词一起找到,(即:不是最好的)否定分数。
3) 将分数乘以手动分配给每个单词的权重。(1.0开始)
4) 将正面和负面的总和相加得到情绪分数。