问题标签 [vader]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
1692 浏览

python - 基于词典的情感分析的准确性

我正在为我获得的一组 Twitter 数据执行不同的情绪分析技术。它们是基于词典的(Vader Sentiment 和 SentiWordNet),因此不需要预先标记的数据。

我想知道是否有一种方法(如 F-Score、ROC/AUC)来计算分类器的准确性。我知道的大多数方法都需要一个目标来比较结果。

0 投票
1 回答
333 浏览

python - VADER NLTK 中的词袋

我一直在阅读 VADER 作为朴素贝叶斯的替代方法进行情绪分析。我了解如何使用 NB 模型检索词袋;

有没有办法可以使用 VADER 来实现相同的输出?

0 投票
2 回答
2294 浏览

python - 如何在不修改 txt 文件的情况下编辑 NLTKs VADER 情感词典

我知道您可以通过手动将它们添加到 vader_lexicon.txt 文件来添加自己的单词。我想知道是否有另一种方法可以在 python 代码中执行此操作,因为我不希望使用我的代码的人需要修改其他 .txt 文件。

这将得到字典。正在考虑类似的事情:

0 投票
2 回答
1214 浏览

python - 用于情感分析的 Python VADER 词典结构

我正在使用 Python 的 nltk 库中的 VADER 情感词典来分析文本情感。这个词典不太适合我的领域,所以我想将我自己的情感分数添加到各种单词中。所以,我得到了词典文本文件(vader_lexicon.txt)来做到这一点。但是,我不太了解该文件的体系结构。例如,像 obliterate 这样的词在文本文件中会有以下数据: obliterate -2.9 0.83066 [-3, -4, -3, -3, -3, -3, -2, -1, -4, - 3]

显然,-2.9 是列表中情绪得分的平均值。但是 0.83066 代表什么?

谢谢!

0 投票
1 回答
4743 浏览

python-3.x - Vader 情绪分析:如何对单个单词进行评分?

所以我使用 Vader Sentiment Analyzer 来分析某些客户反馈。在评估输出时,我看到情绪分析器给我的结果好坏参半。

在这种情况下,O/P 应该是负数,但它给出了一个更接近中性到正数的复合分数,这是没有意义的。

我在 AppData\Roaming\nltk_data\sentiment\vader_lexicon.txt 中看到了这个文件,其中包含大多数英语单词的情绪分数。

我只是想知道这些单独的单词是如何在 pos neg neu 和 Compound 方面给出情感分数的?是否有任何算法/流程来评价它们?

最后,我正在考虑建立自己的情感分析词典以获得更好的结果,但为此我需要知道每个单词是如何分配情感分数的?

0 投票
1 回答
586 浏览

python - Python中的VADER情感分析:从字典中删除单词

我在 Python 的 nltk 库中使用 VADER 情绪分析工具。我想知道是否有人知道如何从词典中删除单词而不必在文本文件中手动删除。使用 lexicon.update(new_words) 可以添加新单词。我们也可以使用类似的东西来删除单词吗?

因此,要添加新词,我们可以使用:

我尝试使用 lexicon.remove 删除单词,但这不起作用。任何意见,将不胜感激。

0 投票
2 回答
4667 浏览

python - 文本挖掘UnicodeDecodeError:'charmap'编解码器无法解码位置1671718的字节0x81:字符映射到

我已经编写了代码来创建频率表。但它正在中断 ext_string = document_text.read().lower(。我什至试了一下,除了捕捉错误,但它没有帮助。

0 投票
1 回答
172 浏览

python - 正面短语在 vader 函数 polar_scores 中有负分

在python中nltk.sentiment.vader,有一个函数叫做polarity_scores,你可以试试用字符串no problem看看结果,是-0.6。

我怎样才能提高维达的表现。如果没有,是否有任何其他包做得更好?

0 投票
1 回答
1138 浏览

python - NLTK 的 Vader 评分文本示例

我希望有人纠正我对 VADER 如何对文本进行评分的理解。我在这里阅读了这个过程的解释,但是在重新创建它描述的过程时,我无法将测试句子的复合分数与 Vader 的输出相匹配。假设我们有这句话:

VADER 选择的词是“喜欢”(+1.5 分)和“有趣”(+2.3)。根据文档,将这些值相加(因此 +3.8),然后使用以下函数将其归一化为 0 到 1 之间的范围:

根据我们的数字,这应该变成:

然而,VADER 会输出返回的复合分数,如下所示:

我的推理哪里出错了?类似的问题已被多次提出,但尚未提供 VADER 分类的实际示例。任何帮助,将不胜感激。

0 投票
1 回答
594 浏览

python - VADER: Sentiment for each sentence

I am new to python and I have a dataset that looks like this

enter image description here

I am extracting the reviews from the dataset and trying to apply the VADER tool to check the sentiment weights associated with each review. I am able to successfully retrieve the reviews but unable to apply VADER to each review. This is the code

Sample output:

I need to customize the labels for each review as well to something like this