我知道我可以从 vader 那里得到这个:{'neg': 0.071, 'neu': 0.895, 'pos': 0.034, 'compound': -0.296}
但他们是一种获得整体结果的方法吗?比如说 {'Positive'} 或 {'Negative'}
还有……我要抬头看看我能用 vader 做什么?比如函数列表什么的。
复合分数是通过将词典中每个单词的效价分数相加,根据规则进行调整,然后归一化到 -1(最极端的负数)和 +1(最极端的正数)之间的值来计算的。如果您想要一个给定句子的单一一维情绪度量,这是最有用的指标。
然后,您可以为negative[-1, 0)、neutral[0, 0.5) 和positive[0.5, 1] 设置阈值以将它们分类。例如:
def get_category(compounded):
if compounded < 0:
return 'negative'
elif compounded < 0.5:
return 'neutral'
else:
return 'positive'
选择最适合您的数据和用例的阈值。