我想对文本进行情感分类(来自社交媒体的帖子,例如推文、facebook 墙贴、youtube 评论等......)。虽然我找不到带有注释数据的好的数据集。我正在寻找的不仅仅是带有正面和负面注释的数据。我正在寻找具有多种情绪的数据集。这可以是离散值(ekman 6 基本情绪)或连续值(唤醒效价模型)。有谁知道我在哪里可以得到这样的数据集,这可以来自 twitter、Facebook、Myspace ......只要它来自社交网络
问问题
1983 次
1 回答
1
好吧,我认为更好的名字(或者,更常用的)是情感分析(情感分类)——对吗?我不确定社交媒体是否确实提供了他们的私人数据(也许是其中的一部分)。无论如何,我找到了这篇论文:
http://www.cs.cornell.edu/home/llee/papers/sentiment.pdf
他们正在处理数据:来自https://groups.google.com/forum/?fromgroups#!aboutgroup/rec.arts的http://www.cs.cornell.edu/people/pabo/movie-review-data/ .movies.reviews。
它适合你吗?基本上,找到合适的数据通常是 ML 中的一个大问题。通常需要自己构建(我的意思是手动对其中的一部分进行分类,然后应用一些聚类或半监督学习)
如果您在网络上找不到任何合适的内容,我会尝试联系一些撰写与您的研究类似的文章的作者。也许他们已经创建了适合您的数据集...
于 2012-12-16T18:32:35.430 回答