r - 当我知道它是 TRUE 时，%in% 返回 FALSE

Question

相关文件：

我正在研究一些自然语言处理，并尝试使用 %in% 检查来检查一个列表中的单词是否在另一个列表中。问题是，当我知道应该至少有几个 TRUE 返回时，它会将所有内容返回为 FALSE。我想知道问题是否与我正在使用的对象类型有关？虽然当我运行测试时，一切都是角色对象，所以我认为这不应该是一个问题。这是我的代码：

library(dplyr)
library(tokenizers)
library(tidytext)

biggie <- read.csv("C:/Users/My.Name/Desktop/biggie.csv", stringsAsFactors=FALSE)

colnames(biggie)[1] <- 'biggie'



bigsplit <- biggie %>% 
  unnest_tokens(word, biggie)

pos <- read.csv("C:/Users/My.Name/Desktop/positive.csv", stringsAsFactors = FALSE)

positive <- function(data){
  pos_count <- 0
  for(i in 1:nrow(data)){
    if (data[i,1] %in% pos){
      pos_count = pos_count + 1
    }
  }
  return(pos_count/nrow(data)
}

在这里，我找到了一种解决方法，但我觉得它在函数中添加了不必要的循环/步骤，并且比我想要的需要更多的计算能力：

#Tests
bigsplit[1,1] = "abound"
bigsplit[1,1] %in% pos #Returns FALSE, but I would expect TRUE
bigsplit[1,1] %in% pos[1,1] #Returns TRUE

#NEW FUNCTION
positive <- function(data){
  pos_count = 0
  for(i in 1:nrow(data)){
    match_this <- data[i,1]
    for(i in 1:nrow(pos)){
      if(match_this %in% pos[i,1]){
        pos_count <- pos_count + 1
      }
    }
  }
  return(pos_count/nrow(data))
}

如果有人对这些问题有任何提示，我将非常感谢听到他们。谢谢！

r - 当我知道它是 TRUE 时，%in% 返回 FALSE

0 回答 0

Related

Reference