正如您在评论中已经提到的,最好使用data.table
极性和移位器表并设置密钥。
如果我用你的文本运行它,我会得到下面的结果。第 1 句为 -1.3,第 2 句为 1.7。请注意,否定词应编码为1L而不是-1L。
library(sentimentr)
library(data.table)
text_to_analyse <- c("Je ne suis pas heureux. Je suis heureux.")
polarity <- data.table(x = "heureux",
y = 3L,
key = "x")
shifters <- data.table(x = "ne",
y = 1L,
key = "x")
sentiment(get_sentences(text_to_analyse),
polarity_dt = polarity,
valence_shifters_dt = shifters)
element_id sentence_id word_count sentiment
1: 1 1 5 -1.341641
2: 1 2 3 1.732051
请意识到这sentimentr
是为英语开发的。对于法语词典,您可以查看以下网站:
FEEL:法语扩展情感词典。http://advanse.lirmm.fr/feel.php
一个法语词典,包含超过 14 000 个表达情感和情绪的不同单词。它遵循埃克曼基本的两极和六种情绪(Ekman,1992)。它是通过自动翻译和扩展英语情感词典 NRC-Canada (Mohammad & Turney, 2013) 创建的。该过程已由人类专业翻译人员手动监督和验证。
可以调整此文件以使其sentimentr
与tidytext
. 我仍然需要调查一下。也许udpipe
对法语来说可能更好。
POLTEXT:https ://www.poltext.org/en/donnees-et-analysiss/lexicoder带有您可以使用的词典quanteda