我正在尝试在 R 中执行情绪分析。我想使用 afinn 或 bing 词典,但问题是我无法标记单词。
以下是我需要感悟的词:
所以有 6 个词我想要表达: Pass Fail Not Ready Out of Business Pass w/conditions No entry
我如何使用任何词典来为这些词分配情绪
这是我的代码:
d<- as.data.frame(data$Results)
d<- as.data.frame(d[1:2000,])
colnames(d) <- "text"
#Making preprocessed file for raw data
preprocess<-data.frame(text=sapply(tweet_corpus_clean, identity),
stringsAsFactors=F)
# tokenize
tokens <- data_frame(text = preprocess$text) %>% unnest_tokens(word, text)
当运行这个我得到:
因为词典要分配情感,每行必须有一个标记
所以我不得不把这些词合并在一起。现在,当我使用 afinn 时,它无法理解什么是 outofbusiness 是显而易见的
tokens <- data_frame(text = preprocess$text) %>% unnest_tokens(word, text)
contributions = tokens %>%ungroup()%>%
inner_join(get_sentiments("afinn"), by = "word") %>%
group_by(word) %>%
summarize(score = as.numeric(sum(score * n) / sum(n))) %>%
arrange(desc(sentiment))
我如何对这 6 个单词进行情感分析?