有一个像“单剂量”这样的文本,我的 python 程序会返回一个包含各种情绪概率的字典,比如
{'joy': 0.18, 'shame': 0.03, 'sadness': 0.53, 'guilt': 0.01, 'disgust': 0.14, 'anger': 0.08, 'fear': 0.007}
(使用 NaiveBayes 分类器和一组训练数据)
然而,如你所见,这段文字并没有任何强烈的情感。因此,我需要另一本词典来说明每种情绪的强度。
作为客户评论中的另一个例子,我希望它为“Fuck this”返回一个强烈的情绪指标,而不是“meh”的弱情绪指标。但更重要的是,我不想标记事实句子,比如“我周六买的”
我没有尝试过任何事情,因为我没有找到任何线索。我唯一希望的是,我将上面的字典直接转换为另一个具有弱点/强度量表的字典,并避免为此目的进行单独的训练和分类过程。
另一件事是,上面字典中的概率总和是 1,但在我想要的输出中,它不一定是 1。(即标准化)
任何想法都值得赞赏。