4

我想比较两个列表(数据框的两行)并计算两个列表之间有多少差异。

例如:

list1=a,b,c,a
list2=a,a,d,d

列表 1 的两个元素在列表 2 中

我可以通过循环和求和来做到这一点,但效率很低。R中有什么功能可以做到这一点吗?

我检查了 setdiff 和 compare 包,但没有找到任何帮助。

谢谢你的想法,

文森特

我的功能如下:

        NRebalancing=function(NamePresent)
        {
          Nbexchange=NamePresent[,2]
          Nbexchange=NamePresent[1,2]=0

          for (i in 2:nrow(NamePresent))
          {
            print(i)
            compteur=0
            NameNeeded=NamePresent[i,]
            NameNeeded=unique(NameNeeded)
            NameNeeded=na.omit(NameNeeded)
            for(j in 2:length(NameNeeded))
              #j=1 correspond a une date
            {
              compteur = compteur+(abs(sum(NamePresent[i,]==as.character(NameNeeded[j]))-sum(NamePresent[i-1,]==as.character(NameNeeded[j]))))
            }
          Nbexchange[i]=compteur  
          }

          return(Nbexchange)
        }
4

2 回答 2

9

一个要点:您的列表不是 R 列表 - 这有点特别。您正在使用向量:

R> is.vector(l1)
[1] TRUE
R> is.list(l1)
[1] FALSE

list1如果它们是向量,请不要调用变量。


因为你有一个向量,所以有很多可能性。

  1. 运营%in%

    R> l1 = c("a", "b", "c", "d")
    R> l2 = c("a", "a", "d", "d")
    R> l1[l1 %in% l2]
     [1] "a" "d"
    
  2. 或使用is.element

    R> l1[is.element(l1, l2)]
     [1] "a" "d"
    
  3. 还有unique

    R> unique(l2)
     [1] "a" "d"
    

    在您对@mrdwab 发表评论后,您可以使用sapply和的组合来计算出现次数unique

    sapply(unique(l1), function(i) sum(i==l2))
    

    i==l2检查成员资格,sum计算 TRUE 出现的次数,sapply基本上只是一个 for 循环unique(l1)

    R> sapply(unique(l1), function(i) sum(i==l2))
    a b c d 
    2 0 0 2
    
  4. @mrdwab 的一个非常好的建议是使用tableand colSums

    R> table(l1, l2)
      l2 l1  
       a d
     a 1 0
     b 1 0
     c 0 1
     d 0 1
    R> colSums(table(l1, l2))
     a d 
     2 2 
    
于 2012-07-16T09:14:46.153 回答
1

你有没有尝试过这样的事情?

list1 = c("a", "b", "c", "a")
list2 = c("a", "a", "d", "d")
list2 %in% list1
# [1]  TRUE  TRUE FALSE FALSE

更新

由于您正在寻找频率,我也认为考虑table.

总的来说,我觉得这个问题有点令人困惑。您的问题表明您正在寻找一个列表 ( list2) 中出现在另一个列表 ( list1) 中的出现次数,但在接受的答案中(在我的coSums(table...示例中,您也在计算d,它没有出现在 中list1。因此,我我提供了最后一个示例table%in%它与您的问题相匹配,但可能不是您想要的。这里是:

table(list2[which(list2 %in% list1)])

# a 
# 2
于 2012-07-16T09:10:50.477 回答