0

我正在尝试在 R 上使用 nrguimaraes 的 VADER 情绪工具来获取几条推文的情绪分数。该工具的描述以及如何安装它在这里描述: https ://rdrr.io/github/nrguimaraes/sentimentSetsR/man/getVaderRuleBasedSentiment.html

但是,当我尝试处理多个元素时,会出现错误。我想编辑该函数,以便它能够处理多个元素。

功能是:

function (text, compound = TRUE) 
{
    text <- iconv(text, to = "UTF-8")
    text <- gsub("\\p{So}|\\p{Cn}", "", text, perl = TRUE)
    text <- gsub("\\s+", " ", text)
    if (is.na(text)) {
        return(NA)
    }
    if (text == "" || text == " ") {
        return(NA)
    }
    return(PolarityScores(text, compound))
}

所以当我跑步时

getVaderRuleBasedSentiment(file$text)

错误出现为

Warning message:
In if (is.na(text)) { :
  the condition has length > 1 and only the first element will be used

我想知道如何编辑此函数以能够处理具有多行文本的数据,例如当您使用 Rtweet 收集推文时。

4

0 回答 0