我目前正在研究 Twitter 中的情绪分析。我想结合预定义的词典资源,如 sentiwordnet 极性分数。然后进行机器学习。问题是在得到sentiwordnet的正确分数上,以前的工作总是简单地通过词义的正负极性总分来选择。我的意思是,例如“mad”这个词可以出现 3 次否定词和 2 次肯定词。以前的大部分工作都会自动平均每个极性。所以我想在得到分数之前消除单词的歧义,这样我们就可以真正使用应该的 sentiwordnet。我在想通过比较目标句和光泽句的相似度..有什么方法可以比较它吗?你认为它会起作用吗?如果没有,请分享您的想法..
我对这个领域和新手python程序员完全陌生,所以我真的需要你的建议..谢谢..