我有一个包含积极和消极词的情感词典以及它们的情感强度值。我的主要工作是检查这个强度值是否对最终分类有影响。这意味着我想检查带有单词“good”(强度= 6)的文本和带有出色(强度= 9)的单词是否具有不同的最终情绪得分。
我在为SVM
. 如果我使用TF-IDF
测量或POS tagging
它不检查强度值。所以我的主要问题是如何在 SVM 中使用这个强度值以及如何生成包含单词强度值的特征向量?
例如,
"This book is good."
对于这句话,如何生成考虑强度值的特征向量?
首先,我想将强度值与词频相乘并将这个加权分数用作特征输入,但这只会增加词频。例如“good”出现了 2 次,然后我将它乘以它的强度值 6,然后它的值变成 12,所以它只会增加单词“good”的出现,对吗?
所以请谁能告诉我是否可以使用情绪强度值
SVM
以及如何使用它?如何使用它们的值生成特征向量?