问题标签 [sentimentr]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - 修改感测器(R 包)数据字典
我正在使用来自 R 包感测器(通过 trinker)的情绪分析功能感测()。想了解如何修改否定器、放大器、去放大器。我可以更新极性表和价移器。
想修改字典以使其适合我的域。例如“令人沮丧的经历 - 每月为这样的糟糕应用支付那么多钱并不酷。不专业”让我的 ave.sentiment 为 0。所以我试图更多地理解字典和权重
还想了解是否有任何特定的文本清理实用程序要运行,然后再将其传递给 Sentiment_by() 函数(如在 qdap 中)。对于感测器包,在这些方面没有太多可用的文档。任何帮助表示赞赏
r - 需要澄清sentimenter(trinker)的情感函数返回的平均极性分数的计算
我正在使用来自 R 包感测器(通过 trinker)的情绪分析功能感测()。我有一个包含以下列的数据框: 查看评论 月 年 我在数据框上运行了 Sentiment_by 函数以查找基于年份和月份的平均极性分数,我得到以下值。
现在我仅根据评论在数据帧上运行sentiment_by 函数,然后在生成的数据帧上运行以下函数以查找基于年份和月份的平均极性分数。
我得到以下结果。
根据我的理解,两者都应该返回相同的结果,如果我错了,请纠正我。我选择第二种方法的原因是因为我需要根据月份和年份以及月份来平均极性,并且我不想使用该方法两次,因为它会导致额外的时间延迟。有人可以让我知道我在这里做错了什么吗?
r - 尝试将单词列表与 R 中的句子列表匹配时出现性能问题
我正在尝试将单词列表与句子列表进行匹配,并使用匹配的单词和句子形成数据框。例如:
预期结果(一个数据框)如下:
我正在使用以下代码来实现这一点。
我有 28k 个句子和 65k 个单词要匹配。上面的代码需要 45 秒才能完成任务。由于当前方法需要大量时间,因此有关如何提高代码性能的任何建议?
编辑:
我只想得到那些与句子中的单词完全匹配的单词。例如 :
现在对于上述情况,我的输出应该如下:
r - dplyr mutate 抛出“错误:无效的下标类型‘闭包’”错误
我正在尝试将sentimentR中的sentiment_by与dplyr的变异一起使用
例如,这有效:
content <- mutate(content, word_count = sentiment_by(story)$word_count)
但
例如,这有效:
content.sd <- mutate(content, word_count = sentiment_by(story)$sd)
给出错误错误:invalid subscript type 'closure'
但sentiment_by(content$story[1])
有效
任何帮助将不胜感激。
r - r中有哪些可用的情感分析包?
在 R 中有各种可用于执行情感分析的软件包:sentimentalanalysis、syuzhet、sentimenter 等等。实际上我只想要情绪-积极的,中性的和消极的。以预测股票走势或证明其走势合理
r - 比较两个文档中的词袋并找到第二个文档中的匹配词及其频率
我计算了“yelp.csv”、“yelpp.csv”、“yelpn.csv”的词袋,并创建了个人数据集的词频矩阵。现在,我想将 yelp 的词袋与 yelpn 进行比较,并检查 yelp 中有多少词出现在 yelpn 中以及它们的频率,并将其存储在一个变量中作为矩阵,然后对于 yelpp 也是如此。yelp包含正面和负面。yelpp,只有正面和 yelpn,只有负面。任何人都可以完成代码吗?我不知道这段代码是否相关,我希望如此。
r - 带有法语词典的 Sentimentr 软件包
我根据要求创建了带有 x 和 y 列的极性和移位器字典(几个单词只是为了测试)。
我收到以下错误:
[.data.frame`(polarity_dt, word_dat[["words"]]) 中的错误:选择了未定义的列
请问你能帮帮我吗?先感谢您。
此致
r - R SentimentAnalysis 包中的情绪分数是如何计算的?
我正在使用带有 SentimentAnalysis 包的 General Inquirer 字典,但我无法弄清楚他们如何分配情绪分数......
例如,如果我运行以下代码:
我会得到这样的输出:
这里使用的秤是什么?-1比1?我不知道如何解释这些结果。
谢谢!
r - 包含多篇报纸文章的数据集的情感分析
我试图在 R 中调用get_nrc_sentiment但收到以下错误:
get_nrc_sentiment(Test) 中的错误:数据必须是字符向量。
谁能看到我做错了什么?
r - Syuzhet 与 SentimentR 的否定词和修饰符用于 R 中的情绪分析
这个问题是双重的。任何一个问题的答案都将是一个适当的解决方案。非常感谢您可以将建议显示为 R 代码。
1) Syuzhet 数据包中的 NRC 词典产生了最广泛的情绪,但它似乎无法控制否定者。阅读文档后,我仍然不确定如何克服这个问题。也许通过将每个句子的正负编码词相乘,例如 I(0) AM(0) NOT(-1) ANGRY(-1) = (-1*-1) = 1。但是,我不知道如何用正确的代码编写它。
2)经过大量研究和测试,我发现 SentimentR 中的 jockers_rinker 词典可以更好地处理否定词和修改(https://github.com/trinker/sentimentr#comparing-sentimentr-syuzhet-meanr-and-stanford)。我可以使用 SentimentR 通过比较两个包的二进制情绪输出来“质量测试”Suyzhet/NRC 结果的结果。如果它们偏离太多,则 NRC 对特定的文本正文不够准确。但是,我只知道如何获得个人分数而不是每种情绪的总分(正面总和和负面总和)
您可以在此处看到我的测试结果如何在连接字符串上与带有和不带有修饰符和否定符的情绪进行比较。
第一个输出似乎没有认识到“非常”、“不是”和“从不”的重要性。