28

我正在实现一个可以检测文本中人类情感的系统。是否有任何手动注释的数据集可用于监督学习和测试?

以下是一些有趣的数据集: https ://dataturks.com/projects/trending

4

1 回答 1

49

文本情感检测领域仍然很新,文献分散在不同领域的许多不同期刊中。很难很好地了解那里的情况。

注意心理学有几种情绪理论。因此,在计算中有不同的建模/表示情绪的方法。大多数时候,“情绪”是指愤怒、恐惧或喜悦等现象。其他理论指出,所有情绪都可以在多维空间中表示(因此它们的数量是无限的)。

这是我知道(更新)的一些(公开可用的)数据集:

  1. 情绪银行。10k 句用 Valence、Arousal 和 Dominance 值注释的句子(披露:我是作者之一)。https://github.com/JULIELab/EmoBank

  2. WASSA 2017 共享任务中的“推文中的情绪强度”数据集。http://saifmohammad.com/WebPages/EmotionIntensity-SharedTask.html

  3. Preotiuc-Pietro 和其他人的价和唤醒 Facebook 帖子: http ://wwbp.org/downloads/public_data/dataset-fb-valence-arousal-anon.csv

  4. Cecilia Ovesdotter Alm 的影响数据:http: //people.rc.rit.edu/~coagla/affectdata/index.html

  5. CrowdFlower 的 Emotion in Text 数据集 https://www.crowdflower.com/wp-content/uploads/2016/07/text_emotion.csv

  6. ISEAR: http ://emotion-research.net/toolbox/toolboxdatabase.2006-10-13.2581092615

  7. SemEval 2007 测试语料库(情感文本任务) http://web.eecs.umich.edu/~mihalcea/downloads.html

  8. 带有情绪的 SemEval Stance 数据的重新注释: http ://www.ims.uni-stuttgart.de/data/ssec

如果您想更深入地了解该主题,这里有一些我推荐的调查(披露:我撰写了第一个)。

  1. Buechel, S. 和 Hahn, U. (2016)。作为回归问题的情绪分析——维度模型及其对情绪表示和度量评估的影响。在 ECAI 2016.22 届欧洲人工智能会议上(第 1114-1122 页)。荷兰海牙(网址:http ://ebooks.iospress.nl/volumearticle/44864 )。

  2. Canales, L. 和 Martínez-Barco, P. (nd)。从文本中检测情绪:一项调查。第 5 个信息系统研究工作日 (JISIC 2014) 中的处理,37(可访问:http ://www.aclweb.org/anthology/W14-6905 )。

于 2016-01-18T17:42:28.813 回答