问题标签 [lexicon]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - 商业情感词典
我正在寻找用于业务上下文的情感词典/词典来执行情感分析。我已经建立了分析和计算部分,但只需要有内容的类。
这是我要构建的示例:
我希望进一步填充这些列表,但仅限于谈论公司股票表现时使用的词语。
谢谢!瑞安
r - 是否可以在 `lexicon` 包的字典中添加术语?
该软件包sentimentr
提供了在句子级别计算文本极性情感的工具,并可选择按行或分组变量聚合。它的功能sentiment
之一是逐句逼近文本的情感(极性)。尤其是,
text.var
是文本变量,而polarity_dt
是lexicon
包提供的字典。我想知道是否可以lexicon
通过向字典中添加单词(及其相应的分数)来扩展字典中的术语集。
r - 如何为 r 文本分析创建定制的贸易/法律词典
我计划在 R 中进行文本分析,就像使用自己的自定义词典按照“贸易”与“法律”逻辑进行情感分析一样。
我在一个 Excel 文件中有字典所需的所有单词。看起来像这样:
为了将其转换为适合 R 的格式并将其应用于我的文本语料库,我必须采取哪些步骤?
谢谢您的帮助!
r - R中的NRC Emolex(词典)
我是一个新手,我正试图与 Rstudio 合作完成我的最终项目。据我所知,NRC Emolex 支持 40 多种语言,包括印度尼西亚语。我的问题是,我仍然不知道如何在印度尼西亚语中使用 NRC Emolex 获得情绪评分。希望大家多多帮助,先谢谢了!
我试过的代码
我要导入和使用的数据https://drive.google.com/file/d/1tzdZlfS-mf2Y6W-bYQC4qMR9n7AEwgfn/view?usp=sharing
r - 更改必应词典中单词的值
我正在使用 R Studio 分析一项调查。我正在使用 tidytext 包中的 Bing Sentiment 词典来执行此操作。
有些词对我的调查没有正确的含义,特别是“温柔”被编码为积极,但我的受访者将“温柔”表示为消极(疼痛)。我知道如何从 bing tibble 中删除一个单词,然后添加一个新单词,但是我怎样才能简单地更改单词的含义呢?
例如:
我希望它看起来像:
谢谢!
r - R情绪分析;找不到“词典”;
我对情绪分析很陌生。我正在根据这里的教程运行代码
它使用的是 tidytext 包。但是我在运行代码时遇到了问题
错误如下
我想这是因为词典列不在情绪数据框中。或者是否更改了 tidytext 包,以至于我无法按照教程运行的方式运行代码?有没有其他方法可以更正代码或运行另一个类似的代码?
预先感谢您的澄清。
sentiment-analysis - 关于感悟者词典是如何构建的问题
我使用Sentimentr 包进行了一些情绪分析,因为它包含价移。但是我找不到这个词典 lexicon::hash_sentiment_jockers_rinker 是如何构建的,单个单词是如何评分的。据我了解,词典最初是由 syuzhet 导出的,是 AFFIN、bing、nrc 和 syuzhet 的组合。有人可以帮助我理解词典中的单个单词是如何计算的吗?
谢谢!
python - 从 python 的 Azure 认知服务(文本到语音)上使用词典的问题
我使用 python 中的 Azure 认知 TTS 已经有一段时间了,使用他们在网络上的示例,它工作得很好。我遇到了一个问题,不得不引入外部词典,所以我制作了它们并将它们添加到命令中。它看起来像这样:
词典是这样描述的:
我收到带有转换文本的音频,我看到 Azure 正在从网络上获取我的词典,但我没有像在词典中那样正确更改文本。
难道我做错了什么?
sentiment-analysis - 情感包是否考虑了句子中的单词数和段落中的句子数?
任何人都可以帮助解释sentimenter包是否占字数?我正在尝试弄清楚单词的数量如何影响情绪得分。是否考虑到人们是否在答案中有更多的句子或每个句子有更多的单词?谢谢!
python - 使用词典查找文本中正面和负面单词的数量,
我试图弄清楚如何创建一个列表列表,其中每个子列表包含给定文本中肯定词和否定词的数量。下面是我正在使用的正负文本文件的名称以及这些文本文件中的单词示例。也是“X_train”变量中的示例文本。以及输出应该是什么样子。
positive_words.txt # 快乐,伟大,惊人
negative_words.txt = # 悲伤,糟糕,可怜
X_train = ['食物很棒,服务很棒','我对我的食物很满意','我的食物味道不好','我很穷,买不到食物所以我很伤心,但至少我有鸡肉' ]
X_train_lexicon_features = ?
上述变量的输出应该是什么样子。
输出:[[2,0],[1,0],[0,1],[0,2]]
# 从上面给出的示例中,X_train 变量中的第一个文本应该产生 [2,0],因为它在 positive_lexicon 中都有“great”和“amazing”。[正负]
下面是一个统计正面和负面单词数量的类。
这是我运行的代码以返回每个文本的正面单词数。
输出:[2,1,0,0]
我不确定的是如何将'count_neg_words'函数混合到上面的代码中,它也会返回一个列表列表,如下所示:[[2,0],[1,0],[0,1],[ 0,2]]。
感谢您的任何建议,并在此先感谢您!