问题标签 [sentiment-analysis]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
machine-learning - 用于情绪分析的 Mahout
使用 mahout 我可以对数据的情绪进行分类。但我被一个混淆矩阵困住了。
我正在使用 mahout 0.7 朴素贝叶斯算法对推文的情绪进行分类。我使用朴素贝叶斯分类器来训练分类器并将推文的情绪分类为“正面”、“负面”或“中性” trainnb
。testnb
样本正训练集
同样,我准备了负面和中性的训练样本,这是一个巨大的数据集。
我提供的示例测试数据推文不包括情绪。
我能够运行 mahout 分类算法,它将分类实例的输出作为混淆矩阵提供。
下一步我需要找出哪些推文表现出积极的情绪,哪些是消极的。使用分类的预期输出:用情绪标记文本。
在 mahout 中,我需要实现哪种算法才能以上述格式获得输出。或需要任何自定义源实现。
要“友好地”显示数据,建议我使用 apache mahout 提供的算法,这将适用于我的 twitter 数据情感分析。
python - 创建阿拉伯语语料库
我正在对阿拉伯语进行情感分析,我想创建自己的语料库,为此,我从 facebook 收集 300 个状态并将它们分为正面和负面,现在我想做这些状态的标记化,为了获得单词列表,然后生成单字和双字,三字并使用交叉折叠验证,我目前正在使用 nltk python,该软件是否能够执行阿拉伯语或 rapis 的任务Minner 会更好地工作,你怎么看,我想知道如何生成二元组、三元组和使用交叉折叠验证,有什么想法吗?
python - LARGE在线会话文本的情感分析
标题说明了一切; 我有一个 SQL 数据库,其中包含在线对话文本。我已经在 Python 中完成了这个项目的大部分工作,所以我想使用 Python 的 NLTK 库来完成这项工作(除非有充分的理由不这样做)。
数据按Thread、Username和Post组织。每个线程或多或少都集中在讨论我有兴趣分析的类别的一个“产品”。最终,当这完成后,我希望每个用户对他们在某个时候讨论过的任何产品都有一个估计的意见(喜欢/不喜欢某种交易)。
所以,我想知道的是:
1)我怎样才能确定每个线程是关于什么产品的?我正在阅读有关关键字提取的信息……这是正确的方法吗?
2)如何根据帖子确定特定用户的情绪?根据我有限的理解,我必须首先“训练”NLTK 识别某些意见指标,然后我是否只是确定这些词出现在文本中时的上下文?
正如您现在可能已经猜到的那样,我之前没有使用 NLP 的经验。从我目前的阅读来看,我认为我可以应付学习它。如果有人能指出我正确的方向,即使现在只是一个基本而粗略的工作模型也会很棒。谷歌对我帮助不大。
PS我有权分析这些数据(以防万一)
nlp - 如何进行网站基准测试?
我正在尝试对一个国家/地区的房地产领域流行的在线趋势进行竞争分析。我必须创建一个不偏向任何特定公司的报告,但它比较或仅显示公司在趋势列表中的表现。我将使用参数Clickstream analysis
来显示公司网站执行情况的统计数据。Sentiment Analysis
在我看来,趋势特定的表现可以用 来描述。如果有其他方法可以有效地做到这一点,我期待任何这样的方法。
现在,我找不到任何共同的趋势。
- 我怎样才能找到所有房地产公司共有的总体趋势?
我尝试使用Google Trends
. 它们提供有关特定搜索词的图形和人口统计信息,并列出了与我不知道如何使用的搜索相关的词。当我从一个国家深入到另一个州时,数量数据非常少。
一旦我掌握了趋势,我就必须找出人们对这些趋势的反应。Sentiment Analysis
是将为我提供此信息的东西。
- 但是,即使我得到了趋势,我将如何获得可以计算其极性的趋势特定数据?
Twitter 和其他社交媒体网站可以提供一些可以进行情绪分析的数据。我使用了这个网站,它给出了与 twitter 上的某些术语相关的积极、消极和中性行为。我需要与此类似的东西,但可以执行此分析的数据集不应仅限于社交媒体。
- 我可以在这份竞争分析报告中添加任何其他实体吗?
该报告将按月生成。我希望在上述任务中实现最大程度的自动化。我正在考虑使用网络抓取来抓取类似格式的数据。我还想知道我应该抓取哪些数据以及应该手动提取哪些数据。
java - 阿拉伯语的情感分析
我正在寻找用阿拉伯语分析情绪,为此我从 facebook 收集一些状态并将它们分类为正面和负面,我正在使用 RapidMiner 软件,所以我进行标记化和词干提取和停用词删除,现在我想要我的语料库将表情符号“:(和:)”视为一种积极和消极的情绪,如何将其添加到我的语料库中。
这是我使用的模型,我必须合并什么运算符才能将笑脸作为正面和负面情绪处理
groovy - 从推特中提取数据
我想实时提取推文,我正在使用 RapidmMiner 进行情绪分析,为了收集数据,我更喜欢使用工具从推特中自动提取它们,我认为 groovy 与 json 使用 weka 可以完成这项任务但是我没有找到一个教程来做到这一点,还有其他简单的工具吗?
nlp - 如何在情感分析中使用上下文相关语法?
是否可以在情感分析中使用上下文相关的语法?如果是,那么如何?基本上,我想做一些短语级别的分析。
java - 如何在 mahout 中使用朴素贝叶斯分类器创建我们自己的情感分析模型?
我是mahout的初学者。我不知道如何在 mahout 中使用朴素贝叶斯分类器创建我们自己的情感分析模型。我想创建自己的模型来对一些日志数据进行情绪分析。是否有执行此操作的分步程序。比如我们必须实现哪些类以及如何创建模型或我们如何在 mahout 中使用现有模型。任何帮助,将不胜感激。提前致谢。
python - 亚洲语言情感分析的代码示例 - Python NLTK
sentiment analysis
这里有一个关于NLTK
(python)的演示http://text-processing.com/demo/sentiment/。
还有情感分析部分的教程
- http://streamhacker.com/2010/06/16/text-classification-sentiment-analysis-eliminate-low-information-features/
- http://streamhacker.com/2010/05/10/text-classification-sentiment-analysis-naive-bayes-classifier/
- http://nltk.googlecode.com/svn/trunk/doc/book/ch07.html
是否有任何完整的代码示例或使用 python NLTK 进行亚洲语言情感分析的工作项目?(尤其适用于中文、日文、韩文或阿拉伯文、希伯来文和波斯文)
java - 在 JAVA 中接收来自 CURL 的响应
我正在使用 Sentiment-140 提供的公共 API 来查找小文本是正面的、负面的还是中性的。虽然我可以成功使用他们简单的 HTTP-JSON 服务,但我在使用 CURL 时失败了。这是我的代码:
我究竟做错了什么?