2

我正在尝试将这些新单词及其相应的极性分数从 CSV 文件添加到 Vader Sentiment Lexicon

生词 csv 在这里

它还反映在更新时的 vadersentiment 对象中:

在此处输入图像描述

但是,一旦我尝试获取新添加单词的极性分数,就会引发错误:

在此处输入图像描述

我对正在发生的事情感到困惑,即使这个词出现在 Vader 词典中:

在此处输入图像描述

有谁知道为什么会这样?

4

1 回答 1

1

一种解决方法是pandas用于读取 CSV 并利用将数据框直接to_dict()转换为 Dictionary

我已将问题中提供的示例数据放入 vader.csv

CSV:

在此处输入图像描述

这是使用 CSV 从 CSV 读取pandas并使用to_dict.

字典:

在此处输入图像描述

解决方案代码

import pandas as pd 
data = pd.read_csv('vader.csv', header=None, index_col=0, squeeze=True, skiprows=1).to_dict()
sa_obj = SentimentIntensityAnalyzer()
sa_obj.lexicon.update(data)
print(sa_obj.lexicon['buffering'])

输出

在此处输入图像描述

笔记:

  1. skiprows=1用于在将数据帧转换为字典时跳过标题
于 2021-01-26T05:41:47.987 回答