问题标签 [sentiment-analysis]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
php - 情绪分析算法建议
我已经实现了简单的朴素贝叶斯分类器和用于情感分析的 k-nn。我正在对情绪分析算法进行比较研究。我想再实现一种情绪分析算法。我研究过 maxent 最大熵模型,但我不知道如何实现它。任何人都可以指导我如何实现它,或者可以提供任何有用的链接。
我的主要目标是将facebook状态或任何句子分类为正面或负面
如果您知道任何其他算法,请建议我提供一些指导来实现它。
java - 如何使用 SentiWordNet
我需要对一些包含推文的 csv 文件进行情绪分析。我正在使用SentiWordNet进行情绪分析。
我得到了他们在他们的网站上提供的以下示例 Java 代码。我不确定如何使用它。我要分析的 csv 文件的路径是C:\Users\MyName\Desktop\tweets.csv
. 的路径SentiWordNet_3.0.0.txt
是C:\Users\MyName\Desktop\SentiWordNet_3.0.0\home\swn\www\admin\dump\SentiWordNet_3.0.0_20130122.txt
。我是java新手,请帮忙,谢谢!下面的示例 java 代码的链接是这个。
新代码:
nlp - 情感分析(SentiWordNet)——判断一个句子的上下文
我试图在以下步骤中找出一个句子是肯定的还是否定的:
1.)使用斯坦福 NLP 解析器从句子中检索词性(动词、名词、形容词等)。
2.) 使用SentiWordNet找到与每个词性相关的正值和负值。
3.) 将得到的正值和负值相加来计算与句子相关的净正值和净负值。
但问题是,SentiWordNet 根据不同的感觉/上下文返回一个正/负值列表。是否可以将特定句子与词性一起传递给 SentiWordNet 解析器,以便它可以自动判断语义/上下文并仅返回一对正负值?
或者这个问题还有其他替代解决方案吗?
谢谢。
java - 评级文章 - 情绪分析
我正在开发一个 Java 程序(分类器),它读取给定的文本文件并输出相关的情绪(正面或负面或中性)。
该程序计算三个类别(正面或负面或中性)的三个概率。鉴于这三个概率,我想给文章打分(最高 10 分)。
示例- 如果假设,
那么很明显,这篇文章是高度正面的,因此评级应该是高的,即 8 或以上。
PS - 概率加起来不等于 1,而且是非常小的数字(在 ~ 10^-(100) 的范围内)
有人可以指出任何可以帮助我评价文章的算法吗?
谢谢
编辑 我不能简单地采用比率。例如
上面显示的概率差异很大。因此,采用比率将毫无意义。
r - r 中 Twitter 情感分析中的表情符号
如何处理/摆脱表情符号,以便对推文进行排序以进行情绪分析?
获取:sort.list(y)中的错误:输入无效
谢谢
这就是表情从 twitter 和 r 中出现的方式:
java - 使用 SentiWordNet 获得不正确的分数
我正在使用 SentiWordNet 进行一些情绪分析,我在这里提到了如何使用 SentiWordNet的帖子。但是,尽管尝试了各种输入,但我的得分为 0.0。我在这里做错了什么吗?谢谢!
这是 SentiWordNet.txt 的前 10 行
c# - 根据表情c#查找句子是肯定的还是否定的
我正在用 c# 做项目,我正在寻找可以帮助我根据表情符号检查句子是积极的、消极的还是模糊的代码。
例如:
- 我爱我的国家 :) - (正面)因为它包含快乐的笑脸
- 我爱我的国家 :( - (负面) 因为它包含悲伤的笑脸
- 天气很好:( :) -(模糊)因为它包含两个笑脸,所以很难判断它是积极的还是消极的。
- 我不想上大学 :( :) :) -(积极)因为它包含两个快乐的笑脸和一个悲伤的笑脸。
我的项目领域是情绪分析。
python - sentiwordnet python中的词义消歧
我目前正在研究 Twitter 中的情绪分析。我想结合预定义的词典资源,如 sentiwordnet 极性分数。然后进行机器学习。问题是在得到sentiwordnet的正确分数上,以前的工作总是简单地通过词义的正负极性总分来选择。我的意思是,例如“mad”这个词可以出现 3 次否定词和 2 次肯定词。以前的大部分工作都会自动平均每个极性。所以我想在得到分数之前消除单词的歧义,这样我们就可以真正使用应该的 sentiwordnet。我在想通过比较目标句和光泽句的相似度..有什么方法可以比较它吗?你认为它会起作用吗?如果没有,请分享您的想法..
我对这个领域和新手python程序员完全陌生,所以我真的需要你的建议..谢谢..
machine-learning - KNN 分类器情感分析 vs 类别分析精度
我在java中实现了KNN分类器,结果很奇怪。如果我对数据集示例亚马逊书评进行情感分析,我得到了 55% 的准确率。从 100 个测试文档中,55 个正确分类为负面或正面评论,45 个错误分类。但如果我将 KNN 用于类别分类示例相机或书籍,那么我的准确率达到 95%。
有一些解释我的代码是错误的?任何想法?
sql - 将(非 CSV)文本数据导入 PostgreSQL,以空格和一个大写字母分隔
这是我第一次使用 SQL。我在 Windows 7 64 位上使用 PostgreSQL。
我有以下(大).txt 推文文件,如下所示:
如您所见,所有三个“列”都以下列方式分隔: T \t
(U 和 W 也是如此)而不是传统的逗号 ( ,
)。我想将整个文件导入一个 SQL 表,其中的列名为date
,user
和text_msg
.
我猜我可能不得不以某种方式解析它。任何想法如何以最简单和最有效的方式将数据放入表中?还请考虑到有问题的 .txt 文件相当大(> 4GB),因此我没有简单的方法来手动编辑它们。