我有一个函数可以接收文本文档和我想在该文本中找到的两个单词,并且我试图找出这两个单词在文本中彼此相邻出现的概率。所以我做的第一件事就是让它们成对。我的文档称为“words”,该函数接受 3 个参数:文档、word1 和 word2。我想弄清楚它们在文本中彼此相邻出现的次数。
pairs <- c()
# Iterates through and creates every possible pair of adjacent words
for (i in 1:(length(words)-1)) {
temp <- paste(words[i],words[i+1], sep = ":") # Temporarily group adjacent words together with a : in between
temp <- sort(strsplit(temp, ":")[[1]]) # Sort to get them lexically organized
pairs[i] <- paste(temp[1], temp[2], sep=":") # Store this pair in the list
}
现在我正在尝试制作一个计数器来计算我的 2 个指定单词一起出现的次数。到目前为止,我已经尝试过了
pairs2<-0
for(i in pairs){
if(i==word1:word2|i==word2:word1){
pairs2<-pairs2+1
}
但我得到了错误
Error in word1:word2 : NA/NaN argument
我如何让 R 明白我希望这些 word1:word2 和 word2:word1 对中的每一个都是两个特定的词,当我有正确的组合时,在计数器上加一个 +1?