我正在实现一个可以检测文本中人类情感的系统。是否有任何手动注释的数据集可用于监督学习和测试?
以下是一些有趣的数据集: https ://dataturks.com/projects/trending
我正在实现一个可以检测文本中人类情感的系统。是否有任何手动注释的数据集可用于监督学习和测试?
以下是一些有趣的数据集: https ://dataturks.com/projects/trending
文本情感检测领域仍然很新,文献分散在不同领域的许多不同期刊中。很难很好地了解那里的情况。
注意心理学有几种情绪理论。因此,在计算中有不同的建模/表示情绪的方法。大多数时候,“情绪”是指愤怒、恐惧或喜悦等现象。其他理论指出,所有情绪都可以在多维空间中表示(因此它们的数量是无限的)。
这是我知道(更新)的一些(公开可用的)数据集:
情绪银行。10k 句用 Valence、Arousal 和 Dominance 值注释的句子(披露:我是作者之一)。https://github.com/JULIELab/EmoBank
WASSA 2017 共享任务中的“推文中的情绪强度”数据集。http://saifmohammad.com/WebPages/EmotionIntensity-SharedTask.html
Preotiuc-Pietro 和其他人的价和唤醒 Facebook 帖子: http ://wwbp.org/downloads/public_data/dataset-fb-valence-arousal-anon.csv
Cecilia Ovesdotter Alm 的影响数据:http: //people.rc.rit.edu/~coagla/affectdata/index.html
CrowdFlower 的 Emotion in Text 数据集 https://www.crowdflower.com/wp-content/uploads/2016/07/text_emotion.csv
ISEAR: http ://emotion-research.net/toolbox/toolboxdatabase.2006-10-13.2581092615
SemEval 2007 测试语料库(情感文本任务) http://web.eecs.umich.edu/~mihalcea/downloads.html
带有情绪的 SemEval Stance 数据的重新注释: http ://www.ims.uni-stuttgart.de/data/ssec
如果您想更深入地了解该主题,这里有一些我推荐的调查(披露:我撰写了第一个)。