我在情感分析或自然语言处理方面没有太多背景,但我在业余时间读了一些关于它的内容。我想进行并尝试分析论坛主题/评论,如 reddit、digg、博客等。我特别有兴趣做一些事情,比如计算激烈的宗教和政治主题的支持、反对和中立评论的数量辩论。这就是我的想法。
1) 找到原发帖人定义了敏感的政治或宗教话题的主题。
2) 对于每条评论,将其归类为支持原始海报或采取相反或中立的立场。
3) 将各种媒体与支持或反对论点的数量进行比较,以确定哪些平台是好的“辩论平台”(即平衡的论点计数)。
我预计的一个大问题是,激烈的话题会引起支持方和反对方的强烈反应,因此简单的快乐/悲伤情绪分析不会解决问题。我只是出于自己的好奇心对这个项目感兴趣,所以如果有人知道类似的研究或实用程序来进行这个实验,我很想听听更多。
有人可以为此任务推荐一个好的情感分析、词典、训练集等吗?