我正在尝试为产品评论和推文等短文本的情感分类任务训练 LSTM 模型。
我正在寻找一个标签为正面/负面/中性的训练集,那里有没有真正基于人类标签而不是开始或表情符号的东西(免费研究)?我发现只有小的训练集导致我的结果很差。我试图增加我的网络和堆叠层的大小,但没有任何改善。
为了开始获得合理的结果(F1 > 0.8),这样的训练集的最小大小是多少。
我正在尝试为产品评论和推文等短文本的情感分类任务训练 LSTM 模型。
我正在寻找一个标签为正面/负面/中性的训练集,那里有没有真正基于人类标签而不是开始或表情符号的东西(免费研究)?我发现只有小的训练集导致我的结果很差。我试图增加我的网络和堆叠层的大小,但没有任何改善。
为了开始获得合理的结果(F1 > 0.8),这样的训练集的最小大小是多少。
你真的只需要列出大约 100 个左右的负面和正面形容词。
请参阅: http:
//na2english.wikispaces.com/file/view/ADJECTIVES%20TO%20DESCRIBE%20FILMS.pdf/400672720/ADJECTIVES%20TO%20DESCRIBE%20FILMS.pdf
http://arxiv.org/ftp/arxiv/papers /1011/1011.4623.pdf
如果您使用它们,显然会引用它们,但语言是免费的,因此您可以将它们用于您的工作。
可能比您构建的数据库的大小更重要的是选择针对您的特定应用程序的单词以提高效率。
您是将该项目用于特定的商业用途还是更广泛的研究工作?