问题标签 [sentiment-analysis]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
0 回答
2991 浏览

analytics - Hadoop 上的大数据语音分析

我是分析领域的新手,偶然发现了对呼叫中心音频执行语音分析的要求。目前,还不清楚需要什么样的分析,但我看到的是情感分析。我听说有内置分析功能的商业呼叫中心平台可用。但我正在寻找有关使用开源解决方案来实现相同目标的建议。不用说,数据量巨大,大数据平台必不可少。

据我了解,

  1. 需要将大量的音频文件转换为文本并将它们加载到 HDFS 中。

问题:有哪些可用的开源解决方案?

2. 然后使用 map\reduce 对加载到 HDFS 的数据执行情感分析。

问题:有哪些开源解决方案可用于执行此操作?

我敢肯定,以我非常基本的理解,我可能错过了 1000 件事,但任何方向都会有很大帮助。

0 投票
1 回答
1263 浏览

machine-learning - 使用情感字典值作为 SVM 中的特征

我有一个包含积极和消极词的情感词典以及它们的情感强度值。我的主要工作是检查这个强度值是否对最终分类有影响。这意味着我想检查带有单词“good”(强度= 6)的文本和带有出色(强度= 9)的单词是否具有不同的最终情绪得分。

我在为SVM. 如果我使用TF-IDF测量或POS tagging它不检查强度值。所以我的主要问题是如何在 SVM 中使用这个强度值以及如何生成包含单词强度值的特征向量?

例如,

对于这句话,如何生成考虑强度值的特征向量?

  • 首先,我想将强度值与词频相乘并将这个加权分数用作特征输入,但这只会增加词频。例如“good”出现了 2 次,然后我将它乘以它的强度值 6,然后它的值变成 12,所以它只会增加单词“good”的出现,对吗?

  • 所以请谁能告诉我是否可以使用情绪强度值SVM以及如何使用它?

  • 如何使用它们的值生成特征向量?

0 投票
4 回答
1998 浏览

sentiment-analysis - 情绪分析

在执行情绪分析时,如何让机器理解我指的是苹果(iphone),而不是苹果(水果)?

感谢您的建议!

0 投票
1 回答
1297 浏览

nlp - LingPipe 和情绪分析

我正在关注这份文件:

http://alias-i.com/lingpipe/demos/tutorial/sentiment/read-me.html使用 lingpipe 进行情绪分析。

其中一个步骤说“假设数据在 POLARITY_DIR 目录中并且存在 SentimentDemo.jar 文件(如果 jar 不存在,则编译它),可以从命令行运行演示”

我找不到 SentimentDemo.jar 文件。试过windows搜索。那么我们如何编译它呢?我不熟悉在 Windows 上使用 Ant 以及如何使用它编译 lingpipe jar 文件 - 感谢任何指导!

另外当我尝试运行代码时:

我收到错误消息:“错误:无法找到或加载主类 PolarityBasic”

我已经配置了polarity_dir,所以我猜这不是问题。

附加信息:

我在 Windows 7 上使用 lingpipe 4.1.0

任何完成本教程的指导表示赞赏,谢谢!

0 投票
1 回答
5033 浏览

analysis - 情感 分析 , 特征 选择

我想知道分析情绪的每个步骤有哪些合适的工具:删除停用词、词干提取、文本的向量表示、特征选择、分类、如何从文本的向量表示传递到特征选择,是否有任何步骤可以遵循和描述这些步骤的示例

0 投票
1 回答
1819 浏览

python - NLTK 情绪分析只返回一个值

我非常讨厌发布关于整个代码块的问题,但在过去的 3 个小时里我一直在研究这个问题,我无法理解正在发生的事情。我从 CSV 文件中检索到大约 600 条推文,这些推文具有不同的分值(介于 -2 到 2 之间),反映了对总统候选人的情绪。

但是,当我在任何其他数据上运行此训练样本时,只返回一个值(正值)。我已经检查了分数是否被正确添加并且它们是正确的。对我来说,从 600 条不同的训练集中将 85,000 条推文都评为“正面”,这对我来说是没有意义的。有人知道这里发生了什么吗?谢谢!

0 投票
0 回答
1513 浏览

r - Rstem和sentiment包安装问题

似乎没有Rstemsentiment包装的 twitter 情绪分析是困难的。我正在尝试Rstem使用 tar.gz 文件安装这个和情感包(因为在 omegahat 或 Timothy P. Jurka 的 github 中没有可用的 Windows 二进制文件),但它给出了一个错误:

软件包“Rstem”的安装具有非零退出状态

我什至尝试了命令提示符。这给出了以下错误。任何线索如何解决它?我的系统是 Windows 7,R 2.15,Rstudio。

0 投票
4 回答
21256 浏览

r - 除了“sentiment”之外,还有其他包可以在 R 中进行情绪分析吗?

R 中的“情感”包已从 Cran 存储库中删除。还有哪些可以进行情绪分析的软件包?

例如,我如何使用其他包重写它?

这里的文档定义为:

0 投票
1 回答
536 浏览

nlp - Apache Stanbol 情绪分析和句子检测不起作用

我正在使用 Apache Stanbol。它适用于增强文本,但是当我尝试情绪分析和句子检测时,它不起作用。

我试过这段代码

但它给出了空白{ }输出,我尝试更改标题属性但没有运气。

我错过了什么吗?我需要先做一些配置吗?

我什至尝试在增强器链中添加分析器,但相同的空白输出,也尝试了 REST API opennlp-sentence,但它没有用。

0 投票
2 回答
232 浏览

c# - C# Regex 在某些特定选项卡后删除句子

如何编写正则表达式以删除某些特定选项卡后的句子?

例如富文本框中的我的文本

本文来自 sentiwordnet。我想在第五个选项卡之后删除句子,例如应该省略单词able#1 句子(即它的光泽),然后在另一个单词无法#1 之后,它的光泽应该被省略。

什么将是它的正则表达式来消除 sentiwordnet 文本文件中单词的光泽。有什么办法可以做到这一点,或者有人可以为我制作一个小样本/空白吗?

输出应该是这样的: