database - 文本中情感检测的数据集

Question

我正在实现一个可以检测文本中人类情感的系统。是否有任何手动注释的数据集可用于监督学习和测试？

score 49 · Accepted Answer

文本情感检测领域仍然很新，文献分散在不同领域的许多不同期刊中。很难很好地了解那里的情况。

注意心理学有几种情绪理论。因此，在计算中有不同的建模/表示情绪的方法。大多数时候，“情绪”是指愤怒、恐惧或喜悦等现象。其他理论指出，所有情绪都可以在多维空间中表示（因此它们的数量是无限的）。

这是我知道（更新）的一些（公开可用的）数据集：

情绪银行。10k 句用 Valence、Arousal 和 Dominance 值注释的句子（披露：我是作者之一）。https://github.com/JULIELab/EmoBank
WASSA 2017 共享任务中的“推文中的情绪强度”数据集。http://saifmohammad.com/WebPages/EmotionIntensity-SharedTask.html
Preotiuc-Pietro 和其他人的价和唤醒 Facebook 帖子： http ://wwbp.org/downloads/public_data/dataset-fb-valence-arousal-anon.csv
Cecilia Ovesdotter Alm 的影响数据：http: //people.rc.rit.edu/~coagla/affectdata/index.html
CrowdFlower 的 Emotion in Text 数据集 https://www.crowdflower.com/wp-content/uploads/2016/07/text_emotion.csv
ISEAR： http ://emotion-research.net/toolbox/toolboxdatabase.2006-10-13.2581092615
SemEval 2007 测试语料库（情感文本任务） http://web.eecs.umich.edu/~mihalcea/downloads.html
带有情绪的 SemEval Stance 数据的重新注释： http ://www.ims.uni-stuttgart.de/data/ssec

如果您想更深入地了解该主题，这里有一些我推荐的调查（披露：我撰写了第一个）。

Buechel, S. 和 Hahn, U. (2016)。作为回归问题的情绪分析——维度模型及其对情绪表示和度量评估的影响。在 ECAI 2016.22 届欧洲人工智能会议上（第 1114-1122 页）。荷兰海牙（网址：http ://ebooks.iospress.nl/volumearticle/44864 ）。
Canales, L. 和 Martínez-Barco, P. (nd)。从文本中检测情绪：一项调查。第 5 个信息系统研究工作日 (JISIC 2014) 中的处理，37（可访问：http ://www.aclweb.org/anthology/W14-6905 ）。

1 回答 1