0

I'm trying to implement Sentiments Analysis functionality and looking for useful features which can be extracted from tweet messages.The features which I have in my mind for now are:

  1. Sentiment words
  2. Emotion icons
  3. Exclamation marks
  4. Negation words
  5. Intensity words(very,really etc)

Is there any other useful features for this task? My goal is not only detect that tweet is positive or negative but also I need to detect level of positivity or negativity(let say in a scale from 0 to 100). Any inputs or references to printed papers are very welcome.

Thanks.

4

3 回答 3

3

其他可能有用的有:

  • 加长词(例如 goooood)
  • 每个单词的 unigrams 和 bigrams(特别是如果你有一个很大的语料库)

关于参考:克里斯托弗·波茨(Christopher Potts)的本教程非常好,切中要害:http ://sentiment.christopherpotts.net/

其他论文:

  • Twitter 作为情感分析和意见挖掘的语料库。亚历山大·帕克,帕特里克·帕鲁贝克
  • 使用远程监督的 Twitter 情绪分类。去等人。2009 年。
  • 来自有偏见和嘈杂数据的 Twitter 上的稳健情绪检测。巴博萨和冯。2010 年。
  • 简短非正式文本中的情绪强度检测。塞尔沃尔等人。(2010)。JAIST
于 2011-11-30T15:09:38.753 回答
2

如果我在推特上发布真正的好消息,很多人可能会开始公开祝贺我。
因此,如果我发布 X,然后从其他人那里收到很多“恭喜”推文,那么 X 可能是积极的。
一般来说,转发我的推文的人的类型和频率可能与其固有的情绪有关。

于 2011-12-01T10:10:27.320 回答
1

我建议以下文章:

于 2011-12-05T13:13:40.693 回答